Анализ эмпирического распределения. Выборочное наблюдение

Автор работы: Пользователь скрыл имя, 21 Мая 2012 в 15:18, курсовая работа

Описание работы

Ряд распределения – это распределение единиц совокупности по значению того или иного признака.
Анализ ряда распределения включает:
 Табличное и графическое представление ряда распределения;
 Расчёт и анализ выборочных статистик;
 Характеристику формы распределения;
 Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.

Содержание работы

Введение
1. Основная часть
1.1. Анализ эмпирического распределения
1.1.1. Исходные данные
1.1.2. Графическое и табличное представление вариационного ряда распределения
1.1.3. Вычисление выборочных статистик для количества интервалов k=9
1.1.4. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения
1.2. Проведение выборочного наблюдения
1.2.1. Получение выборок
1.2.2. Графическое представление результатов выборочного наблюдения
Заключение
Список использованных источников

Файлы: 1 файл

курсовик СТАТИСТИКА.doc

— 1.24 Мб (Скачать файл)

Государственное образовательное учреждение

высшего профессионального образования

«Санкт-Петербургский  государственный политехнический  университет» 

Факультет экономики и менеджмента

Кафедра «Предпринимательство и коммерция» 
 
 

КУРСОВОЙ  ПРОЕКТ 

по дисциплине «Статистика» 
 
 
 

Выполнил  студент группы 5077/76

М.В. Алексеева

Принял 

_____________________ Н.В. Куприенко

Оценка: __________________

«___» ___________ 2011 года 

Санкт-Петербург

2011 

Оглавление 
 
 
 
 
 
 
 
 
 
 
 
 

Введение

Ряд распределения  – это распределение единиц совокупности по значению того или иного признака.

Анализ ряда распределения включает:

  • Табличное и графическое представление ряда распределения;
  • Расчёт и анализ выборочных статистик;
  • Характеристику формы распределения;
  • Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.
 

Одна  из важнейших целей изучения рядов  распределения состоит в том, чтобы выявить закономерность распределения  и определить ее характер. 

  1. Основная  часть
    1. Анализ эмпирического распределения

Анализ  распределений направлен на выявление  закономерности изменения частот в  зависимости от значений варьирующего признака и анализ различных характеристик  изучаемого распределения. Прежде, чем  приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы – это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности. Для удобства локализации и устранения выбросов необходимо ранжировать исходные данные.

      1. Исходные  данные

Исходные  данные (вар.1-22)

Объем статистической совокупности N=167 

    Таблица 1.1

    Статистическая совокупность (N=167) 

198.3 235.0 313.3 271.5 176.9 230.3 283.8 257.7 347.7 314.7
339.1 337.5 282.0 298.6 351.1 338.8 298.5 287.2 262.5 277.4
280.7 296.1 371.7 200.6 203.9 265.2 277.0 315.2 320.7 244.5
233.3 318.1 320.3 293.7 337.0 265.3 311.4 326.0 299.3 244.0
209.8 350.0 215.5 273.2 265.3 256.1 237.3 203.9 278.3 286.7
244.8 246.0 355.0 309.6 260.1 241.9 294.4 287.9 290.3 250.8
286.8 351.6 284.9 334.6 243.9 412.7 377.9 287.4 326.1 236.5
218.3 333.7 272.8 253.7 237.9 344.6 328.6 320.9 298.0 251.1
345.6 247.8 216.6 286.5 310.4 267.1 238.3 316.3 415.9 251.2
307.9 251.8 162.9 239.2 312.5 292.0 312.8 280.3 323.9 368.2
336.7 277.0 270.5 215.1 367.7 284.1 350.9 354.0 188.9 295.4
250.2 339.9 274.1 200.6 293.8 258.4 262.7 312.7 379.1 340.1
285.1 242.3 331.6 234.4 349.8 393.6 260.9 277.6 243.9 325.9
347.6 424.0 288.1 249.8 286.6 260.6 268.1 414.5 328.4 331.6
303.9 323.7 380.6 329.6 236.7 289.5 307.2 191.9 270.6 248.8
342.4 343.5 302.7 348.5 192.1 286.0 279.3 389.0 302.9 264.6
437.9 294.6 336.8 371.1 410.0 299.3 268.6      

      1. Графическое и табличное представление  вариационного ряда распределения
 

    Вариационным  называется ряд распределения, построенный  по количественному признаку. Он может  быть представлен в графическом  и табличном виде. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

    Объем статистической совокупности равен 167. Для дальнейшей работы вариационного ряда распределения необходимо ранжировать исходные данные.

    Таблицы вариационных рядов строятся по принципам  группировки.

Определим количество групп по «STURGES's»-формуле: 

    k = 1 + 3.322lgN,                                  (1.1) 

    где k – число групп; N – объем совокупности.

    По  формуле число групп получается равным 8.

    Ранжированный ряд распределения представлен  в таблице 2.1. 

    Таблица 1.2

Ранжированный ряд распределения (N=167)

№   п/п Var1 №   п/п Var1 №   п/п Var1 №   п/п Var1 №   п/п Var1 №   п/п Var1
1 162.9 31 244.5 61 271.7 91 293.8 121 323.9 151 351.6
2 176.9 32 244.8 62 272.8 92 294.4 122 325.9 152 354.0
3 188.9 33 246.0 63 273.2 93 294.6 123 326.0 153 355.0
4 191.9 34 247.8 64 274.1 94 295.4 124 326.1 154 367.7
5 192.1 35 248.8 65 277.0 95 296.1 125 328.4 155 368.2
6 198.3 36 249.8 66 277.0 96 298.0 126 328.6 156 371.1
7 200.6 37 250.2 67 277.4 97 298.5 127 329.6 157 377.9
8 200.6 38 250.8 68 277.6 98 298.6 128 331.6 158 379.1
9 203.9 39 251.1 69 278.3 99 299.3 129 331.6 159 380.6
10 203.9 40 251.2 70 279.3 100 299.3 130 333.7 160 389.0
11 209.8 41 251.8 71 280.3 101 302.7 131 334.6 161 393.6
12 215.1 42 253.7 72 280.7 102 302.9 132 336.7 162 410.0
13 215.5 43 256.1 73 282.0 103 303.9 133 336.8 163 412.7
14 216.6 44 257.7 74 283.8 104 307.2 134 337.0 164 414.5
15 218.3 45 258.4 75 284.1 105 307.9 135 337.5 165 415.9
16 230.3 46 260.1 76 284.9 106 309.6 136 338.8 166 424.0
17 233.3 47 260.6 77 285.1 107 310.4 137 339.1 167 437.9
18 234.4 48 260.9 78 286.0 108 311.4 138 339.9    
19 235.0 49 262.5 79 286.5 109 312.5 139 340.1    
20 236.5 50 262.7 80 286.6 110 312.7 140 342.4    
21 236.7 51 264.6 81 286.7 111 312.8 141 343.5    
22 237.3 52 265.2 82 286.8 112 313.3 142 344.6    
23 237.9 53 265.3 83 287.2 113 314.7 143 345.6    
24 238.3 54 265.3 84 287.4 114 315.2 144 347.6    
25 239.2 55 267.1 85 287.9 115 316.3 145 347.7    
26 241.9 56 268.1 86 288.1 116 318.1 146 348.5    
27 242.3 57 268.6 87 289.5 117 320.3 147 349.8    
28 243.9 58 270.5 88 290.3 118 320.7 148 350.0    
29 243.9 59 270.6 89 292.0 119 320.9 149 350.9    
30 244.0 60 271.5 90 293.7 120 323.7 150 351.1    

 

   С помощью программы получаем табличные представления вариационного ряда распределения, построенные с использованием разного числа интервалов k=8, k=9, k=10, k=12, k=14 (рис.1.1). 

а) k=8

 

б) k=9

 
 
 
 
 
 
 
 
 

в) k=10

 

г) k=12

 

д) k=14

Рисунок 1.1. Число интервалов k=8, k=9, k=10, k=12, k=14

    В таблицах первая графа (From…to…) содержит интервалы значений статистической совокупности.

    Count – абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением.

    ComulativeCount – накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам.

    Percent – частости (относительные частоты wi, выражаются в процентах), рассчитываются:

 

wi доля каждой группы в общем объеме совокупности.

      ComulativePercent – накопленные частости – это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.

    Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.

    С помощью программы, на основе таблиц, строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности. В нашем случае, на основе задания, строим полигон (рис. 1.2.), кумуляту (рис. 1.3.) и гистограмму (рис. 1.4) в относительных (wi) частотах. 
 
 
 
 
 
 
 
 
 
 
 
 

а) k=8 

      

б) k=9

 
 
 
 
 

в) k=10

 

г) k=12

 
 
 
 
 

д) k=14

Рисунок 1.2. Полигоны распределения при k=8, k=9, k=10, k=12, k=14 

а) k=8

 
 
 
 

б) k=9

в) k=10

 
 
 
 
 

г) k=12

д) k=14

Рисунок 1.3. Кумуляты распределения при k=8, k=9, k=10, k=12, k=14 
 
 
 

а) k=8

б) k=9

 
 
 
 
 

в) k=10

г) k=12

 
 
 
 
 

д) k=14

Рисунок 1.4. Гистограммы распределений с наложенными на них кривыми нормального распределения с числом интервалов k=8, k=9, k=10, k=12, k=14

      На  основе построенных графиков делаем вывод, что наиболее приемлемый вариант для данного вида статистики при k=9, так как кривая нормального распределения, обозначенная на гистограмме, захватывает все вершины.

      1. Вычисление  выборочных статистик  для количества интервалов k=9

     Статистический  анализ вариационных рядов распределения  предполагает расчет характеристик центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.

     В качестве показателей центральной  тенденции распределения используются: среднее арифметическое значение, мода и медиана. Основными показателями вариации являются: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Для характеристики структуры распределения используются следующие показатели: медиана, квартили, децили и прочие перцентили. Изучение формы распределения предполагает оценку асимметрии и эксцесса (куртозиса). Перечисленные показатели имеют самостоятельное аналитическое значение, поскольку отражают разные свойства изучаемой совокупности, а все вместе они позволяют получить комплексную характеристику эмпирического распределения.

Информация о работе Анализ эмпирического распределения. Выборочное наблюдение