Статистический анализ рядов распределения

Автор работы: Пользователь скрыл имя, 24 Ноября 2013 в 03:48, курсовая работа

Описание работы

Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещены понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Изучены формы и закономерности распределения.

Содержание работы

Введение 1
Глава 1. Понятие статистических рядов распределения и их виды 1
Глава 2. Методология расчета различных видов средних 5
2.1 Особенности расчета и использования степенных средних 5
2.2 Понятие и сфера использования структурных средних 11
2.3 Использование показателей вариации в анализе рядов распределения 17
2.4 Виды дисперсий и правило их сложения 22
2.5 Понятие о закономерностях распределения
Изучение формы распределения 26
2.6 Динамика распределения населения по величине среднедушевых денежных доходов по Российской Федерации за 2006 г. и 2011 г. 31
Заключение 34
Список использованной литературы 36

Файлы: 1 файл

Курсовая.docx

— 161.59 Кб (Скачать файл)

Кроме квартилей  в вариационных рядах распределения  могут определяться децили – варианты, делящие ранжированный ряд на десять равных частей. Первый дециль (d1) делит совокупность в соотношении 1/10 к 9/10, второй дециль (d2) – в соотношении 2/10 к 8/10 и т.д.

Вычисляются они  по той же схеме, что и медиана, и квартили:

 

 

Приведем пример расчета первого дециля по данным таблицы 5:

Первый дециль находится в интервале от 5000 до 7000, накопленная частота которого равна 22001 тыс. чел. Исходя из этого, получим:

 

Это значит, что 10% населения России имеет доход  меньше, чем 5666,7 руб.

Значения признака, делящие ряд на сто частей, называются перцентилями. Эта характеристика применяется  лишь при необходимости подробного изучения структуры вариационного  ряда.

2.3 Использование показателей вариации в анализе рядов распределения

Рассматривая  зарегистрированные в процессе статистического  наблюдения величины того или иного  признака у отдельных единиц совокупности, можно обнаружить между ними различия.

Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называется вариацией.

Показатели вариации делятся на две группы:

    1. Абсолютные;
    2. Относительные.

1. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Самым простым  абсолютным показателем является размах вариации (R). Размах показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака. Его рассчитывают как разность между наибольшим (xmax) и наименьшим (xmin) значениями варьирующего признака, т.е.

 

Рассчитаем размах вариации по данным таблицы 6:

 

Это означает, что  разница между наибольшим и наименьшим значениями варьирующего признака равна  31500 руб.

Таблица 6 - Распределение населения по величине среднедушевых денежных доходов по Российской Федерации за 2011г.

Группы населения  по величине денежных доходов, руб. в  месяц

Население, тыс. чел. (f)

Середины интервалов (x)

   

до 3500

4000

2750

-16008,2

-64032982,19

3500–5000

6429

4250

-14508,2

-93273510,62

5000–7000

11572

6000

-12758,2

-147638417,5

7000–10000

19144

8500

-10258,2

-196383852,7

10000–15000

28287

12500

-6258,2

-177026991,8

15000–25000

35431

20000

1241,8

43996602,04

25000–35000

17287

30000

11241,8

194336209,2

свыше 35000

20715

40000

21241,8

440022943,5

Все население

142865

-

81000

1356711510


 

Размах вариации – важный показатель колеблемости признака, но не исчерпывающий его характеристику. Для анализа вариации необходим и показатель, который отражает все колебания варьирующего признака, дающий обобщенную характеристику. Этим показателем является среднее линейное отклонение (d). Этот показатель применяется для обобщения колебаний и рассеянности значений признака.

Среднее линейное отклонение вычисляется как средняя  арифметическая из абсолютных значений отклонений вариант  и , по следующей формуле:

 

 

Покажем расчет среднего линейного отклонения на следующем примере (табл. 5).

Ранее уже была найдена средняя величина, и она  равна:

 

Затем, используя  вспомогательные расчеты в таблице, вычислим среднее линейное отклонение:

 

Таково в среднем  отклонение вариантов признака от их средней величины.

При вычислении размаха вариации и среднего линейного  отклонения приходится допускать некорректные с точки зрения математики действия, нарушать законы алгебры, что и побудило математиков и статистиков искать иной способ оценки вариации. Самый  простой выход – возвести все  отклонения во вторую степень. Это простое  решение привело к большим  научным результатам.

Полученная мера вариации называется дисперсией (), а корень квадратный из дисперсии – средним квадратическим отклонением ()*. Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется:

 

 

Также есть упрощенная формула дисперсии:

 

Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности, и рассчитывается по формуле:

 

Рассмотрим расчет дисперсии и среднего квадратического отклонения по данным табл. 7.

Группы населения  по величине денежных доходов, руб. в  месяц

Население, тыс. чел. (f)

Середины интервалов (x)

     

до 3500

4000

2750

1025055701907,5

7562500,0

30250000000,0

3500–5000

6429

4250

1353234995035,6

18062500,0

116123812500,0

5000–7000

11572

6000

1883607182102,1

36000000,0

416592000000,0

7000–10000

19144

8500

2014553782795,2

72250000,0

1383154000000,0

10000–15000

28287

12500

1107878382877,2

156250000,0

4419843750000,0

15000–25000

35431

20000

54632976524,9

400000000,0

14172400000000,0

25000–35000

17287

30000

2184679945675,7

900000000,0

15558300000000,0

свыше 35000

20715

40000

9346859319828,1

1600000000,0

33144000000000,0

Все население

142865

-

18970502286746,2

3190125000,0

69240663562500,0





Таблица 7 - Распределение населения по величине среднедушевых денежных доходов по Российской Федерации за 2011г.

 

Так как  то

 

 

 

 

2. Вторая группа показателей вычисляется как отношение абсолютных показателей вариации к средней арифметической (или медиане). Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др.

До сих пор говорилось о показателях вариации, выраженных в абсолютных величинах. Но для целей сравнения колеблемости различных признаков в одной и той же совокупности используются показатели вариации, приведенные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Различают следующие относительные показатели вариации (V):

Коэффициент осцилляции (VR):

 

Линейный коэффициент  вариации ():

 

Коэффициент вариации ():

 

Рассчитаем коэффициент  вариации по данным табл. 6:

 

Так как совокупность считается однородной, если коэффициент  вариации не превышает 33%, а 81,73% > 33%, то данная совокупность не однородна, а средняя нетипична для данного ряда распределения.

Среди множества  варьирующих признаков, изучаемых  статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными.

Пусть p – доля единиц в совокупности, обладающих данным признаком (p=m/n); q – доля единиц, не обладающих данным признаком, причем p+q=1.

Альтернативный  признак принимает два значения – 0 и 1 с весами соответственно q и p. Вычислим среднее значение альтернативного  признака:

 

Дисперсия определяется по формуле:

 

Показатель энтропии (Hx) представляет собой отрицательную сумму произведения вероятностей различных значений случайной величины (pi) на логарифмы (при основании два) этих вероятностей, т.е.

 

Таким образом  энтропия распределения показывает, имеет ли закономерность в сосредоточении отдельных градаций наименьшее количество позиций или, напротив, заполненность  распределения одинаковая.

Относительная энтропия определяется как отношение  ее фактической величины к максимальной, т.е.

 

Это отношение  изменяется от нуля до единицы и  может быть интерпретировано. Чем  меньше относительная энтропия, тем  меньше неопределенность и выше однородность.

2.4 Виды дисперсий и правило их сложения

Иногда необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Для этого вычисляются и анализируются различные виды дисперсий.

Выделяют дисперсию  общую, межгрупповую и внутригрупповую.

Общая дисперсия () измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

 

Межгрупповая  дисперсия () характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:

 

где – соответственно групповые средние и численности по отдельным группам.

Внутригрупповая дисперсия () отражает случайную вариацию, т.е. число вариации, происходящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

 

Средняя из внутригрупповых  дисперсий ():

 

Существует соотношение, связывающее три вида дисперсий, оно называется правилом сложения дисперсий:

 

Рассмотрим расчет перечисленных выше дисперсий на примере (табл. 8 и 9):

Рассчитаем общую  и групповые средние и дисперсии:

 

 

Таблица 8 – производительность труда двух групп рабочих одного из цехов НПО «Циклон».

Производительность  труда рабочих

Прошедших техническое  обучение             (деталей за смену)

Не прошедших  техническое обучение             (деталей за смену)

84

93

95

101

102

62

68

82

88

105


 

 

 

Рассчитаем общую  среднюю, среднюю из внутригрупповых  дисперсий, межгрупповую и общую  дисперсию по данных таблицы  8:

Таблица 9 – расчет по двум группам рабочих.

Группы рабочих

Численность рабочих, человек

Средняя, дет./смен.

Дисперсия

Прошедших техническое  обучение

5

95

42,0

Не прошедших  техническое обучение

5

81

231,2

Все рабочие

10

-

-


Рассчитаем среднюю  для всей совокупности:

 

Среднюю из внутригрупповых  дисперсий:

 

Межгрупповую  дисперсию:

 

Общую дисперсию:

 

В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического  коэффициента детерминации ():

 

Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного  отношения ():

 

Оно характеризует  влияние признака, положенного в  основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если =0, то группировочный признак не оказывает влияния на результативный. Если =1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки.

Рассчитаем коэффициент детерминации и эмпирическое корреляционное отношение по данным таблицы 7:

 

Таким образом, рассчитанное значение эмпирического корреляционного отношения свидетельствует о заметной связи между производительностью труда рабочих, прошедших техническое обучение и не прошедших техническое обучение.

Наряду с вариацией  количественных признаков может  наблюдаться и вариация качественных признаков. Такое изучение вариации достигается, как и для доли количественных признаков, посредством вычисления и анализа следующих видов  дисперсий.

Внутригрупповая дисперсия доли определяется по формуле:

 

Средняя из внутригрупповых  дисперсий рассчитывается так:

 

Формула межгрупповой дисперсии имеет вид:

 

где    численность единиц в отдельных группах;

 доля изучаемого признака во всей совокупности, которая определяется по формуле:

 

Общая дисперсия  определяется по формуле:

 

Три вида дисперсий  связаны между собой следующим  образом:

 

Это соотношение  дисперсий называется теоремой сложения дисперсии доли признака.

2.5 Понятие о закономерностях распределения                                      Изучение формы распределения

В предыдущих разделах в вариационных рядах распределения можно заметить определенную зависимость между изменением значений варьирующего признака и частот. Частоты в этих рядах с увеличением значения варьирующего признака первоначально увеличиваются, а затем после достижения какой-то максимальной величины в середине ряда уменьшаются. Это свидетельствует о том, что частоты в вариационных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности изменения частот в вариационных рядах называются закономерностями распределения.

Основная задача анализа вариационных рядов –  выявление подлинной закономерности распределения путем исключения влияния второстепенных, случайных  для данного распределения факторов – достигается увеличением объема исследуемой совокупности при одновременном уменьшении интервала ряда.

Информация о работе Статистический анализ рядов распределения