Автор работы: Пользователь скрыл имя, 24 Ноября 2013 в 03:48, курсовая работа
Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещены понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Изучены формы и закономерности распределения.
Введение 1
Глава 1. Понятие статистических рядов распределения и их виды 1
Глава 2. Методология расчета различных видов средних 5
2.1 Особенности расчета и использования степенных средних 5
2.2 Понятие и сфера использования структурных средних 11
2.3 Использование показателей вариации в анализе рядов распределения 17
2.4 Виды дисперсий и правило их сложения 22
2.5 Понятие о закономерностях распределения
Изучение формы распределения 26
2.6 Динамика распределения населения по величине среднедушевых денежных доходов по Российской Федерации за 2006 г. и 2011 г. 31
Заключение 34
Список использованной литературы 36
Кроме квартилей в вариационных рядах распределения могут определяться децили – варианты, делящие ранжированный ряд на десять равных частей. Первый дециль (d1) делит совокупность в соотношении 1/10 к 9/10, второй дециль (d2) – в соотношении 2/10 к 8/10 и т.д.
Вычисляются они по той же схеме, что и медиана, и квартили:
Приведем пример расчета первого дециля по данным таблицы 5:
Первый дециль находится в интервале от 5000 до 7000, накопленная частота которого равна 22001 тыс. чел. Исходя из этого, получим:
Это значит, что 10% населения России имеет доход меньше, чем 5666,7 руб.
Значения признака, делящие ряд на сто частей, называются перцентилями. Эта характеристика применяется лишь при необходимости подробного изучения структуры вариационного ряда.
Рассматривая зарегистрированные в процессе статистического наблюдения величины того или иного признака у отдельных единиц совокупности, можно обнаружить между ними различия.
Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называется вариацией.
Показатели вариации делятся на две группы:
1. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.
Самым простым абсолютным показателем является размах вариации (R). Размах показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака. Его рассчитывают как разность между наибольшим (xmax) и наименьшим (xmin) значениями варьирующего признака, т.е.
Рассчитаем размах вариации по данным таблицы 6:
Это означает, что разница между наибольшим и наименьшим значениями варьирующего признака равна 31500 руб.
Таблица 6 - Распределение населения по величине среднедушевых денежных доходов по Российской Федерации за 2011г.
Группы населения по величине денежных доходов, руб. в месяц |
Население, тыс. чел. (f) |
Середины интервалов (x) |
||
до 3500 |
4000 |
2750 |
-16008,2 |
-64032982,19 |
3500–5000 |
6429 |
4250 |
-14508,2 |
-93273510,62 |
5000–7000 |
11572 |
6000 |
-12758,2 |
-147638417,5 |
7000–10000 |
19144 |
8500 |
-10258,2 |
-196383852,7 |
10000–15000 |
28287 |
12500 |
-6258,2 |
-177026991,8 |
15000–25000 |
35431 |
20000 |
1241,8 |
43996602,04 |
25000–35000 |
17287 |
30000 |
11241,8 |
194336209,2 |
свыше 35000 |
20715 |
40000 |
21241,8 |
440022943,5 |
Все население |
142865 |
- |
81000 |
1356711510 |
Размах вариации – важный показатель колеблемости признака, но не исчерпывающий его характеристику. Для анализа вариации необходим и показатель, который отражает все колебания варьирующего признака, дающий обобщенную характеристику. Этим показателем является среднее линейное отклонение (d). Этот показатель применяется для обобщения колебаний и рассеянности значений признака.
Среднее линейное отклонение вычисляется как средняя арифметическая из абсолютных значений отклонений вариант и , по следующей формуле:
Покажем расчет среднего линейного отклонения на следующем примере (табл. 5).
Ранее уже была найдена средняя величина, и она равна:
Затем, используя
вспомогательные расчеты в
Таково в среднем отклонение вариантов признака от их средней величины.
При вычислении
размаха вариации и среднего линейного
отклонения приходится допускать некорректные
с точки зрения математики действия,
нарушать законы алгебры, что и побудило
математиков и статистиков
Полученная мера вариации называется дисперсией (), а корень квадратный из дисперсии – средним квадратическим отклонением ()*. Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется:
Также есть упрощенная формула дисперсии:
Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности, и рассчитывается по формуле:
Рассмотрим расчет дисперсии и среднего квадратического отклонения по данным табл. 7.
Группы населения по величине денежных доходов, руб. в месяц |
Население, тыс. чел. (f) |
Середины интервалов (x) |
|||
до 3500 |
4000 |
2750 |
1025055701907,5 |
7562500,0 |
30250000000,0 |
3500–5000 |
6429 |
4250 |
1353234995035,6 |
18062500,0 |
116123812500,0 |
5000–7000 |
11572 |
6000 |
1883607182102,1 |
36000000,0 |
416592000000,0 |
7000–10000 |
19144 |
8500 |
2014553782795,2 |
72250000,0 |
1383154000000,0 |
10000–15000 |
28287 |
12500 |
1107878382877,2 |
156250000,0 |
4419843750000,0 |
15000–25000 |
35431 |
20000 |
54632976524,9 |
400000000,0 |
14172400000000,0 |
25000–35000 |
17287 |
30000 |
2184679945675,7 |
900000000,0 |
15558300000000,0 |
свыше 35000 |
20715 |
40000 |
9346859319828,1 |
1600000000,0 |
33144000000000,0 |
Все население |
142865 |
- |
18970502286746,2 |
3190125000,0 |
69240663562500,0 |
Таблица 7 - Распределение населения по величине среднедушевых денежных доходов по Российской Федерации за 2011г.
Так как то
2. Вторая группа показателей вычисляется как отношение абсолютных показателей вариации к средней арифметической (или медиане). Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др.
До сих пор говорилось о показателях вариации, выраженных в абсолютных величинах. Но для целей сравнения колеблемости различных признаков в одной и той же совокупности используются показатели вариации, приведенные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Различают следующие относительные показатели вариации (V):
Коэффициент осцилляции (VR):
Линейный коэффициент вариации ():
Коэффициент вариации ():
Рассчитаем коэффициент вариации по данным табл. 6:
Так как совокупность считается однородной, если коэффициент вариации не превышает 33%, а 81,73% > 33%, то данная совокупность не однородна, а средняя нетипична для данного ряда распределения.
Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными.
Пусть p – доля единиц в совокупности, обладающих данным признаком (p=m/n); q – доля единиц, не обладающих данным признаком, причем p+q=1.
Альтернативный признак принимает два значения – 0 и 1 с весами соответственно q и p. Вычислим среднее значение альтернативного признака:
Дисперсия определяется по формуле:
Показатель энтропии (Hx) представляет собой отрицательную сумму произведения вероятностей различных значений случайной величины (pi) на логарифмы (при основании два) этих вероятностей, т.е.
Таким образом энтропия распределения показывает, имеет ли закономерность в сосредоточении отдельных градаций наименьшее количество позиций или, напротив, заполненность распределения одинаковая.
Относительная энтропия определяется как отношение ее фактической величины к максимальной, т.е.
Это отношение изменяется от нуля до единицы и может быть интерпретировано. Чем меньше относительная энтропия, тем меньше неопределенность и выше однородность.
Иногда необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Для этого вычисляются и анализируются различные виды дисперсий.
Выделяют дисперсию общую, межгрупповую и внутригрупповую.
Общая дисперсия () измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:
Межгрупповая дисперсия () характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:
где – соответственно групповые средние и численности по отдельным группам.
Внутригрупповая дисперсия () отражает случайную вариацию, т.е. число вариации, происходящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:
Средняя из внутригрупповых дисперсий ():
Существует соотношение, связывающее три вида дисперсий, оно называется правилом сложения дисперсий:
Рассмотрим расчет перечисленных выше дисперсий на примере (табл. 8 и 9):
Рассчитаем общую
и групповые средние и
Таблица 8 – производительность труда двух групп рабочих одного из цехов НПО «Циклон».
Производительность труда рабочих | |||||||||
Прошедших техническое обучение (деталей за смену) |
Не прошедших
техническое обучение | ||||||||
84 |
93 |
95 |
101 |
102 |
62 |
68 |
82 |
88 |
105 |
Рассчитаем общую среднюю, среднюю из внутригрупповых дисперсий, межгрупповую и общую дисперсию по данных таблицы 8:
Таблица 9 – расчет по двум группам рабочих.
Группы рабочих |
Численность рабочих, человек |
Средняя, дет./смен. |
Дисперсия |
Прошедших техническое обучение |
5 |
95 |
42,0 |
Не прошедших техническое обучение |
5 |
81 |
231,2 |
Все рабочие |
10 |
- |
- |
Рассчитаем среднюю для всей совокупности:
Среднюю из внутригрупповых дисперсий:
Межгрупповую дисперсию:
Общую дисперсию:
В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации ():
Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения ():
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если =0, то группировочный признак не оказывает влияния на результативный. Если =1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки.
Рассчитаем коэффициент детерминации и эмпирическое корреляционное отношение по данным таблицы 7:
Таким образом, рассчитанное значение эмпирического корреляционного отношения свидетельствует о заметной связи между производительностью труда рабочих, прошедших техническое обучение и не прошедших техническое обучение.
Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков. Такое изучение вариации достигается, как и для доли количественных признаков, посредством вычисления и анализа следующих видов дисперсий.
Внутригрупповая дисперсия доли определяется по формуле:
Средняя из внутригрупповых дисперсий рассчитывается так:
Формула межгрупповой дисперсии имеет вид:
где численность единиц в отдельных группах;
доля изучаемого признака во всей совокупности, которая определяется по формуле:
Общая дисперсия определяется по формуле:
Три вида дисперсий связаны между собой следующим образом:
Это соотношение дисперсий называется теоремой сложения дисперсии доли признака.
В предыдущих разделах в вариационных рядах распределения можно заметить определенную зависимость между изменением значений варьирующего признака и частот. Частоты в этих рядах с увеличением значения варьирующего признака первоначально увеличиваются, а затем после достижения какой-то максимальной величины в середине ряда уменьшаются. Это свидетельствует о том, что частоты в вариационных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности изменения частот в вариационных рядах называются закономерностями распределения.
Основная задача
анализа вариационных рядов –
выявление подлинной
Информация о работе Статистический анализ рядов распределения