Анализ вариационных рядов

Автор работы: Пользователь скрыл имя, 15 Ноября 2011 в 14:07, курсовая работа

Описание работы

Цель курсового проекта – изучить некоторые статистические методы: анализ вариационных рядов.

Содержание работы

Введение 3
1. Вариационные ряды 4
1.1. Построение и графическое изображение вариационных рядов 5
1.2. Основные показатели среднего уровня вариационного ряда 9
1.3. Показатели вариации и способы их расчета 13
2. Анализ вариационных рядов 16
Заключение 21
Список используемой литературы 22
Приложение 23

Скачать архив (76.12 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

Курсовой проект-анализ вариац.ряда.doc

— 289.50 Кб (Скачать файл)

Средняя арифметическая обладает рядом свойств:

Средняя арифметическая постоянной величины а равна этой же постоянной величине: .

Сумма отклонений значений вариантов от средней равна нулю:

(если частоты равны единице);

(если частоты различны).

Если из всех вариантов х_iвычесть постоянную величину х₀ и на основе разностей вычислить среднюю , то она будет меньше средней исходного ряда на эту постоянную величину. Поэтому, чтобы получить среднюю из исходных вариантов, необходимо к средней прибавить ту же постоянную величину х₀: .
Если все варианты х_iразделить на постоянную величину i и из частных () вычислить среднюю, то она будет меньше средней исходного ряда в h раз. Для того чтобы получить среднюю из исходных вариантов, нужно среднюю умножить на эту же постоянную величину i: .
Если у всех вариантов х_iчастоты f_i равны друг другу, то средняя арифметическая взвешенная равна средней арифметической простой.

Поскольку средняя арифметическая вычисляется как отношение суммы значений х_iк их общей численности, то она никогда не выходит за пределы этих значений, а находится между минимальным и максимальным значениями х_i. При увеличении или уменьшении каждого значения х_i средняя арифметическая также увеличивается или уменьшается.

Важнейшей характеристикой центра распределения, кроме средней арифметической, является мода. Мода – это значение признака, которое чаще всего встречается в вариационном ряду. Во многих случаях эта величина наиболее характерна для ряда распределения и вокруг нее концентрируется большая часть вариантов. При изменении распределения в его концах мода не меняется, т.е. она обладает определенной устойчивостью к вариации признака. Поэтому моду наиболее удобно применять при изучении рядов с неопределенными границами.

Для дискретного ряда мода находится непосредственно по определению. Для интервального ряда с равными интервалами:

где x_Мо - нижняя граница модального интервала;

i_Мо - величина модального интервала;

f_Мо - частота модального интервала;

f_Мо-1 - частота интервала, предшествующего модальному;

f_Мо+1 - частота интервала, следующего за модальным.

Графически моду определяют по гистограмме распределения. Для этого выбирают самый высокий прямоугольник, который и является модальным, далее верхнюю правую вершину модального прямоугольника соединяют с верхней правой вершиной предшествующего прямоугольника, а верхнюю левую вершину модального прямоугольника с верхней левой вершиной последующего прямоугольника. Абсцисса точки пересечения этих отрезков и будет модой распределения.

В статистическом анализе часто применяют структурные, или порядковые, средние, например медиану. В отличие от средней арифметической, на которую оказывают влияние все значения х_i, структурные средние совершенно не зависят от крайних значений признака. Медианой называют такое значение признака, которое приходится на середину ранжированного ряда. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака, превышающие медиану, другая – меньше медианы. Для дискретного ряда медиана находится непосредственно по определению на основе накопленных частот. В случае интервального вариационного ряда медиану определяют по следующей формуле:

где x_Ме - нижняя граница медианного интервала;

i - величина интервала;

S_-1 - накопленная частота интервала, которая предшествует медианному;

f_Ме - частота медианного интервала.

Из определения медианы следует, что она не зависит от тех значений признака, которые расположены по обе стороны от нее. В связи с этим медиана является лучшей характеристикой центральной тенденции в тех случаях, когда концы распределений расплывчаты (например, границы крайних интервалов открыты) или в ряду распределения имеются чрезмерно большие или малые значения.

В интервальном ряду медиану можно определить графически. Медиана рассчитывается по кумуляте. Для этого из точки на шкале накопленных частот, соответствующей , проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения и является медианой.

1.3. Показатели вариации и способы их расчета

В практическом анализе оценка рассеяния значений признака может оказаться не менее важной, чем определение средней. Самая грубая оценка рассеяния, легко определяемая по данным вариационного ряда, может быть дана с помощью размаха вариации:

R = x_max- x_min,

где x_max и x_min – наибольшее и наименьшее значение варьирующего признака.

Этот показатель представляет интерес в тех случаях, когда важно знать, какова амплитуда колебаний значений признака, например, каковы колебания цены на данный товар в течение недели или разным регионам в данный отрезок времени.

Однако этот показатель не дает представления о характере вариационного ряда, расположении вариантов вокруг средней и может сильно меняться, если добавить или исключить крайние варианты (когда эти значения аномальны для данной совокупности).

Для оценки колеблемости значений признака относительно средней используются характеристики рассеяния. Они различаются выбранной формой средней и способами оценки отклонений от нее отдельных вариантов. К таким показателям относятся: среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.

Среднее линейное отклонение есть средняя арифметическая из абсолютных значений отклонений отдельных вариантов от их средней величины:

формула среднего линейного отклонения для несгруппированных данных:

формула среднего линейного отклонения для сгруппированных данных:

где х_i – значение признака или середина интервала в интервальном ряду;

f_i – частота признака.

Среднее линейное отклонение выражено в тех же единицах измерения, что и варианты или их средняя. Оно дает абсолютную меру вариации.

Чтобы избежать равенства нулю суммы отклонений от средней, используют либо абсолютные значения отклонений, либо их четные степени, например квадраты. В последнем случае мера вариации называется дисперсией и обозначается D или :

для несгруппированных данных:

для сгруппированных данных:

Однако вследствие суммирования квадратов отклонений дисперсия дает искаженное представление об отклонениях, измеряя их в квадратных единицах. Поэтому на основе дисперсии вводятся еще две характеристики: среднее квадратическое отклонение и коэффициент вариации.

Среднее квадратическое отклонение измеряется в тех же единицах, что и варьирующий признак, и исчисляется путем извлечения квадратного корня из дисперсии:

для несгруппированных данных:

для сгруппированных данных:

Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько в среднем откланяются конкретные варианты признака от его среднего значения. Величина часто используется в качестве единицы измерения отклонений от средней арифметической. Отклонение, выраженное в , называется нормированным или стандартизированным.

Для оценки меры вариации и ее значимости пользуются также коэффициентом вариации V, который дает относительную оценку вариации и получается путем сопоставления среднего линейного или среднего квадратического отклонения со средним уровнем явления, а результат выражается в процентах:

либо ().

Так как коэффициенты вариации дают относительную характеристику однородности явлений и процессов, они позволяют сравнивать степень вариации разных признаков.

2. Анализ вариационных рядов

Первичные статистические данные часто представлены неупорядоченной последовательностью чисел, характеризующих ту или иную сторону процесса. В этой совокупности чисел бывает трудно разобраться и первичная обработка материалов сводится к приведению имеющихся данных к виду, удобному для анализа. Для начала необходимо поставить задачи анализа:

Построить интервальный ряд распределения.
Дать графическое изображение в виде гистограммы и кумуляты.
Определить показатели центра распределения.
Определить показатели вариации.

После этого можно начать обработку статистических данных.

Построим интервальный ряд распределения на основе статистических данных указанных в таблице 2 в приложении.

Размах вариации стажа равен:

R = x_max- x_min = 19-1 = 18 лет

Для определения оптимального числа групп и длину интервала используем формулы Стерджесса :

n = 1 + 3,322*lgN = 1+3,322*lg30 = 5,88 6 (количество интервалов);

= года (длина интервала).

Таким образом, с помощью полученных данных разобьем стаж рабочих на интервалы и занесем в таблицу (табл.3). Посчитаем число рабочих в каждом интервале (граф.1).

Группировка работников промышленного предприятия по стажу:

Таблица 3

Стаж рабочих, х	Число рабочих, f	Кумулятивная частота, s	Середин. интервал, х_i	х_i*f_i
A	1	2	3	4	5	6	7
1 - 4	5	5	2,5	12,5	5,8	29	168,2
4 - 7	9	14	5,5	49,5	2,8	25,2	70,56
7 - 10	6	20	8,5	51	0,2	1,2	0,24
10 - 13	6	26	11,5	69	3,2	19,2	61,44
13 - 16	1	27	14,5	14,5	6,2	6,2	38,44
16 - 19	3	30	17,5	52,5	9,2	27,6	253,92
Итого:	30	-	-	249	27,4	108,4	592,8

Информация о работе Анализ вариационных рядов