Автор работы: Пользователь скрыл имя, 21 Мая 2012 в 15:18, курсовая работа
Ряд распределения – это распределение единиц совокупности по значению того или иного признака.
Анализ ряда распределения включает:
Табличное и графическое представление ряда распределения;
Расчёт и анализ выборочных статистик;
Характеристику формы распределения;
Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.
Введение
1. Основная часть
1.1. Анализ эмпирического распределения
1.1.1. Исходные данные
1.1.2. Графическое и табличное представление вариационного ряда распределения
1.1.3. Вычисление выборочных статистик для количества интервалов k=9
1.1.4. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения
1.2. Проведение выборочного наблюдения
1.2.1. Получение выборок
1.2.2. Графическое представление результатов выборочного наблюдения
Заключение
Список использованных источников
Государственное образовательное учреждение
высшего профессионального образования
«Санкт-Петербургский
государственный
Факультет экономики и менеджмента
Кафедра
«Предпринимательство и коммерция»
КУРСОВОЙ
ПРОЕКТ
по дисциплине «Статистика»
Выполнил студент группы 5077/76
М.В. Алексеева
Принял
_____________________ Н.В. Куприенко
Оценка: __________________
«___» ___________
2011 года
Санкт-Петербург
2011
Оглавление
Ряд распределения – это распределение единиц совокупности по значению того или иного признака.
Анализ ряда распределения включает:
Одна
из важнейших целей изучения рядов
распределения состоит в том,
чтобы выявить закономерность распределения
и определить ее характер.
Анализ распределений направлен на выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы – это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности. Для удобства локализации и устранения выбросов необходимо ранжировать исходные данные.
Исходные данные (вар.1-22)
Объем
статистической совокупности N=167
Таблица 1.1
Статистическая
совокупность (N=167)
198.3 | 235.0 | 313.3 | 271.5 | 176.9 | 230.3 | 283.8 | 257.7 | 347.7 | 314.7 |
339.1 | 337.5 | 282.0 | 298.6 | 351.1 | 338.8 | 298.5 | 287.2 | 262.5 | 277.4 |
280.7 | 296.1 | 371.7 | 200.6 | 203.9 | 265.2 | 277.0 | 315.2 | 320.7 | 244.5 |
233.3 | 318.1 | 320.3 | 293.7 | 337.0 | 265.3 | 311.4 | 326.0 | 299.3 | 244.0 |
209.8 | 350.0 | 215.5 | 273.2 | 265.3 | 256.1 | 237.3 | 203.9 | 278.3 | 286.7 |
244.8 | 246.0 | 355.0 | 309.6 | 260.1 | 241.9 | 294.4 | 287.9 | 290.3 | 250.8 |
286.8 | 351.6 | 284.9 | 334.6 | 243.9 | 412.7 | 377.9 | 287.4 | 326.1 | 236.5 |
218.3 | 333.7 | 272.8 | 253.7 | 237.9 | 344.6 | 328.6 | 320.9 | 298.0 | 251.1 |
345.6 | 247.8 | 216.6 | 286.5 | 310.4 | 267.1 | 238.3 | 316.3 | 415.9 | 251.2 |
307.9 | 251.8 | 162.9 | 239.2 | 312.5 | 292.0 | 312.8 | 280.3 | 323.9 | 368.2 |
336.7 | 277.0 | 270.5 | 215.1 | 367.7 | 284.1 | 350.9 | 354.0 | 188.9 | 295.4 |
250.2 | 339.9 | 274.1 | 200.6 | 293.8 | 258.4 | 262.7 | 312.7 | 379.1 | 340.1 |
285.1 | 242.3 | 331.6 | 234.4 | 349.8 | 393.6 | 260.9 | 277.6 | 243.9 | 325.9 |
347.6 | 424.0 | 288.1 | 249.8 | 286.6 | 260.6 | 268.1 | 414.5 | 328.4 | 331.6 |
303.9 | 323.7 | 380.6 | 329.6 | 236.7 | 289.5 | 307.2 | 191.9 | 270.6 | 248.8 |
342.4 | 343.5 | 302.7 | 348.5 | 192.1 | 286.0 | 279.3 | 389.0 | 302.9 | 264.6 |
437.9 | 294.6 | 336.8 | 371.1 | 410.0 | 299.3 | 268.6 |
Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в графическом и табличном виде. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.
Объем статистической совокупности равен 167. Для дальнейшей работы вариационного ряда распределения необходимо ранжировать исходные данные.
Таблицы вариационных рядов строятся по принципам группировки.
Определим
количество групп по «STURGES's»-формуле:
k
= 1 + 3.322lgN,
где k – число групп; N – объем совокупности.
По формуле число групп получается равным 8.
Ранжированный
ряд распределения представлен
в таблице 2.1.
Таблица 1.2
Ранжированный ряд распределения (N=167)
№ п/п | Var1 | № п/п | Var1 | № п/п | Var1 | № п/п | Var1 | № п/п | Var1 | № п/п | Var1 |
1 | 162.9 | 31 | 244.5 | 61 | 271.7 | 91 | 293.8 | 121 | 323.9 | 151 | 351.6 |
2 | 176.9 | 32 | 244.8 | 62 | 272.8 | 92 | 294.4 | 122 | 325.9 | 152 | 354.0 |
3 | 188.9 | 33 | 246.0 | 63 | 273.2 | 93 | 294.6 | 123 | 326.0 | 153 | 355.0 |
4 | 191.9 | 34 | 247.8 | 64 | 274.1 | 94 | 295.4 | 124 | 326.1 | 154 | 367.7 |
5 | 192.1 | 35 | 248.8 | 65 | 277.0 | 95 | 296.1 | 125 | 328.4 | 155 | 368.2 |
6 | 198.3 | 36 | 249.8 | 66 | 277.0 | 96 | 298.0 | 126 | 328.6 | 156 | 371.1 |
7 | 200.6 | 37 | 250.2 | 67 | 277.4 | 97 | 298.5 | 127 | 329.6 | 157 | 377.9 |
8 | 200.6 | 38 | 250.8 | 68 | 277.6 | 98 | 298.6 | 128 | 331.6 | 158 | 379.1 |
9 | 203.9 | 39 | 251.1 | 69 | 278.3 | 99 | 299.3 | 129 | 331.6 | 159 | 380.6 |
10 | 203.9 | 40 | 251.2 | 70 | 279.3 | 100 | 299.3 | 130 | 333.7 | 160 | 389.0 |
11 | 209.8 | 41 | 251.8 | 71 | 280.3 | 101 | 302.7 | 131 | 334.6 | 161 | 393.6 |
12 | 215.1 | 42 | 253.7 | 72 | 280.7 | 102 | 302.9 | 132 | 336.7 | 162 | 410.0 |
13 | 215.5 | 43 | 256.1 | 73 | 282.0 | 103 | 303.9 | 133 | 336.8 | 163 | 412.7 |
14 | 216.6 | 44 | 257.7 | 74 | 283.8 | 104 | 307.2 | 134 | 337.0 | 164 | 414.5 |
15 | 218.3 | 45 | 258.4 | 75 | 284.1 | 105 | 307.9 | 135 | 337.5 | 165 | 415.9 |
16 | 230.3 | 46 | 260.1 | 76 | 284.9 | 106 | 309.6 | 136 | 338.8 | 166 | 424.0 |
17 | 233.3 | 47 | 260.6 | 77 | 285.1 | 107 | 310.4 | 137 | 339.1 | 167 | 437.9 |
18 | 234.4 | 48 | 260.9 | 78 | 286.0 | 108 | 311.4 | 138 | 339.9 | ||
19 | 235.0 | 49 | 262.5 | 79 | 286.5 | 109 | 312.5 | 139 | 340.1 | ||
20 | 236.5 | 50 | 262.7 | 80 | 286.6 | 110 | 312.7 | 140 | 342.4 | ||
21 | 236.7 | 51 | 264.6 | 81 | 286.7 | 111 | 312.8 | 141 | 343.5 | ||
22 | 237.3 | 52 | 265.2 | 82 | 286.8 | 112 | 313.3 | 142 | 344.6 | ||
23 | 237.9 | 53 | 265.3 | 83 | 287.2 | 113 | 314.7 | 143 | 345.6 | ||
24 | 238.3 | 54 | 265.3 | 84 | 287.4 | 114 | 315.2 | 144 | 347.6 | ||
25 | 239.2 | 55 | 267.1 | 85 | 287.9 | 115 | 316.3 | 145 | 347.7 | ||
26 | 241.9 | 56 | 268.1 | 86 | 288.1 | 116 | 318.1 | 146 | 348.5 | ||
27 | 242.3 | 57 | 268.6 | 87 | 289.5 | 117 | 320.3 | 147 | 349.8 | ||
28 | 243.9 | 58 | 270.5 | 88 | 290.3 | 118 | 320.7 | 148 | 350.0 | ||
29 | 243.9 | 59 | 270.6 | 89 | 292.0 | 119 | 320.9 | 149 | 350.9 | ||
30 | 244.0 | 60 | 271.5 | 90 | 293.7 | 120 | 323.7 | 150 | 351.1 |
С
помощью программы получаем табличные
представления вариационного ряда распределения,
построенные с использованием разного
числа интервалов k=8,
k=9, k=10, k=12, k=14 (рис.1.1).
а) k=8
б) k=9
в) k=10
г) k=12
д) k=14
Рисунок 1.1. Число интервалов k=8, k=9, k=10, k=12, k=14
В таблицах первая графа (From…to…) содержит интервалы значений статистической совокупности.
Count – абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением.
ComulativeCount – накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам.
Percent – частости (относительные частоты wi, выражаются в процентах), рассчитываются:
wi– доля каждой группы в общем объеме совокупности.
ComulativePercent – накопленные частости – это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.
Табличное
представление вариационного
С
помощью программы, на основе таблиц,
строятся графики, наглядно представляющие
закономерность распределения анализируемой
статистической совокупности. В нашем
случае, на основе задания, строим полигон
(рис. 1.2.), кумуляту (рис. 1.3.)
и гистограмму (рис. 1.4) в относительных
(wi)
частотах.
а)
k=8
б) k=9
в) k=10
г) k=12
д) k=14
Рисунок
1.2. Полигоны распределения при k=8,
k=9, k=10, k=12, k=14
а) k=8
б) k=9
в) k=10
г) k=12
д) k=14
Рисунок 1.3. Кумуляты
распределения при k=8,
k=9, k=10, k=12, k=14
а) k=8
б) k=9
в) k=10
г) k=12
д) k=14
Рисунок 1.4. Гистограммы распределений с наложенными на них кривыми нормального распределения с числом интервалов k=8, k=9, k=10, k=12, k=14
На основе построенных графиков делаем вывод, что наиболее приемлемый вариант для данного вида статистики при k=9, так как кривая нормального распределения, обозначенная на гистограмме, захватывает все вершины.
Статистический анализ вариационных рядов распределения предполагает расчет характеристик центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.
В качестве показателей центральной тенденции распределения используются: среднее арифметическое значение, мода и медиана. Основными показателями вариации являются: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Для характеристики структуры распределения используются следующие показатели: медиана, квартили, децили и прочие перцентили. Изучение формы распределения предполагает оценку асимметрии и эксцесса (куртозиса). Перечисленные показатели имеют самостоятельное аналитическое значение, поскольку отражают разные свойства изучаемой совокупности, а все вместе они позволяют получить комплексную характеристику эмпирического распределения.
Информация о работе Анализ эмпирического распределения. Выборочное наблюдение