Автор работы: Пользователь скрыл имя, 30 Января 2015 в 11:50, курсовая работа
Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.
Ряды распределения могут быть:
• атрибутивным, если они строятся на основе атрибутивного признака.
• вариационным, если они строятся на основе количественного признака;
ВВЕДЕНИЕ 4
1. Табличное и графическое представление вариационного ряда 6
2. Характеристика центральной тенденции распределения 12
3. Оценка вариации изучаемого признак 14
4. Характеристика структуры распределения 17
6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения. 20
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 25
Государственное образовательное учреждение
высшего профессионального образования
«Санкт-Петербургский государственный политехнический университет»
Факультет экономики и менеджмента
Кафедра «Предпринимательство и коммерция»
КУРСОВОЙ ПРОЕКТ
по дисциплине «Статистика»
на тему «Статистический анализ рядов распределения.
Проверка гипотезы о законе распределения»
Выполнил студент группы з4077/26
___________________
(подпись)
_ Николаев А.В, _
(Фамилия.И.О.)
Принял _ к.э.н., доцент__
(должность, ученая степень)
__________________
(подпись)
_ Пономарева О.А._
(Фамилия.И.О.)
__________________
(Дата)
Санкт-Петербург
2011
Николаев А.В. Статистический анализ рядов распределения. Проверка гипотезы о законе распределения: Курсовой проект по дисциплине «Статистика». – СПб.: СПбГПУ, 2011, стр. ___, табл. ___, рис. ___.
РЯД РАСПРЕДЕЛЕНИЯ, МЕДИАНА, МОДА, РАЗМАХ ВАРИАЦИИ, ДИСПЕРСИЯ, КВАРТИЛЬ, КОЭФФИЦИЕНТ АСИММЕТРИИ, КОЭФФИЦИЕНТ ЭКСЦЕССА, СРЕДНЕЕ КВАДРАТИЧНОЕ ОТКЛОНЕНИЕ.
СОДЕРЖАНИЕ
Введение
Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.
Ряды распределения могут быть:
Изучение вариационных рядов распределения позволяет:
Комплексный анализ рядов распределения включает в себя:
Исходными данными для анализа служит информация о банковских вкладах (депозиты) физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году. Объем исходной совокупности – 80 единиц.
1. Табличное и графическое
представление вариационного
Анализ распределений направлен на выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы – это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности.
Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные.
Таблица 1
Исходные данные, ранжированные по возрастанию значений признака
№ региона |
Сумма на банковских счетах |
№ региона |
Сумма на банковских счетах |
№ региона |
Сумма на банковских счетах |
№ региона |
Сумма на банковских счетах |
№ региона |
Сумма на банковских счетах |
№ региона |
Сумма на банковских счетах |
1 |
5110 |
16 |
5297 |
31 |
188 |
46 |
3824 |
61 |
1519 |
76 |
1522 |
2 |
2998 |
17 |
5186 |
32 |
1306 |
47 |
3001 |
62 |
245 |
77 |
1369 |
3 |
4720 |
18 |
97468* |
33 |
219 |
48 |
11578 |
63 |
1030 |
78 |
2656 |
4 |
9356 |
19 |
1921 |
34 |
481 |
49 |
4325 |
64 |
6536 |
79 |
356 |
5 |
3157 |
20 |
5186 |
35 |
1427 |
50 |
14180 |
65 |
9583 |
80 |
795 |
6 |
3277 |
21 |
4439 |
36 |
- |
51 |
5481 |
66 |
7840 |
||
7 |
2027 |
22 |
4187 |
37 |
18348* |
52 |
4147 |
67 |
8823 | ||
8 |
3085 |
23 |
2702 |
38 |
9141 |
53 |
15415 |
68 |
6295 | ||
9 |
3724 |
24 |
… |
39 |
2413 |
54 |
7910 |
69 |
5081 | ||
10 |
28328* |
25 |
5305 |
40 |
7772 |
55 |
4345 |
70 |
2804 | ||
11 |
2382 |
26 |
1608 |
41 |
10808 |
56 |
1840 |
71 |
2212 | ||
12 |
3795 |
27 |
1659 |
42 |
9102 |
57 |
12838 |
72 |
4826 | ||
13 |
2969 |
28 |
26098* |
43 |
1308 |
58 |
15726 |
73 |
5525 | ||
14 |
3372 |
29 |
1069 |
44 |
1562 |
59 |
9141 |
74 |
5058 | ||
15 |
3593 |
30 |
956 |
45 |
11855 |
60 |
329 |
75 |
2054 |
Затем, в ППП Statistica строится график Box plot на основании ранжированной совокупности. Единицы совокупности, обозначенные на графике звёздочками (*), являются выбросами, которые необходимо исключить из изучаемой совокупности.
Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.
Таблицы вариационных рядов строятся по принципам группировки. Определим число групп по формуле Стерджеса:
(1.1)
где k – число групп; N – объем совокупности.
Конечный вариант таблицы должен отвечать следующим требованиям: в таблице не должно быть малонаполненных и нулевых групп; нужно стремиться к получению мономодального распределения (т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот). Если не удается избавиться от многовершинности в распределении, это означает, что изучаемая статистическая совокупность неоднородна и требует более детального изучения.
Таблицы вариационного ряда, построенные с использованием разного числа интервалов.
Рис. 1.1. Банковские вклады (депозиты) физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году.
(k = 15.)
Рис. 1.2. Банковские вклады (депозиты) физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году (k = 6)
При k = 15 получено много малонаполненных групп, что является нежелательным для анализа ряда распределения. Выбирая окончательный вариант табличного представления вариационного ряда в работе, следует остановиться на группировке с использованием 6 групп. Тогда величина группировочного интервала составит 2589,67.
Необходимо подвести предварительные итоги: в 26 регионах России, что составляет 35,1% от общего числа регионов, банковские вклады физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003гогу составили от 2777,67 руб. до 5367,34 руб. В 54 регионах России (72,9% от всех регионов) банковские вклады в среднем на одного жителя в 2003 году составили менее 5367,34 рубля.
На основе таблиц построим графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности.
Рис. 1.3. Полигон распределения регионов России по сумме банковских вкладов на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году.
Рис. 1.4. Гистограмма распределение регионов России по сумме банковских вкладов физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году
Рис. 1.5. Кумулята распределение регионов России по сумме банковских вкладов на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году.
.
2. Характеристика центральной тенденции распределения
Среднее значение признаков совокупности, мода и медиана характеризуют центральную тенденцию распределения, указывают тот уровень признака, который является типичным, характерным для данной совокупности. Использование того или иного показателя распределения зависит от типа исходных данных и цели исследования. Поскольку средняя величина рассчитывается на единицу совокупности, но с использованием всех индивидуальных значений признака, она является обобщённой характеристикой всей совокупности.
Средняя арифметическая простая:
, (2.1)
где – значение признака у i-ой единицы совокупности; n – объём совокупности.
Мода:
,
(2.2)
где - нижняя граница модального интервала; - величина группировочного интервала; – частота модального интервала; / – частота интервала, предшествующего / следующего за модальным.
Медиана:
где – нижняя граница медианного интервала; – величина группировочного интервала; – сумма частот ( ); – накопленная частота интервала, предшествующего медианному; – частота медианного интервала.
Таблица 2
Показатели центра распределения
Показатель центра распределения |
Значение |
Среднее значение |
4606,365 |
Мода |
Multiple |
Медиана |
3658,500 |
В среднем в регионах России в 2003 году на банковских вкладах физических лиц находилось 4606,365 рублей.
3. Оценка вариации изучаемого признака
Вариация – различия у индивидуального значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:
Размах вариации:
, (3.1)
где и – максимальное и минимальное значение признака совокупности.
Дисперсия:
, (3.2)
где – значение признака у i-ой единицы совокупности; – средняя арифметическая; – частота у i-ой единицы совокупности; – сумма частот ( ).
Среднее квадратическое (стандартное) отклонение:
. (3.3)
Коэффициент вариации:
. (3.4)
Таблица 3
Показатели вариации
Показатели вариации |
Значение |
Размах вариации |
15538,00 |
Дисперсия |
14163878 |
Среднее квадратическое отклонение |
3763,493 |
Коэффициент вариации |
87,7% |
Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 15538,00 единиц. Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей, в том числе и коэффициент вариации, в данном случае равный 87,7%. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность можно признать неоднородной, т.к. коэффициент вариации больше 33%.
В 2003 году в регионах России сумма банковских вкладов, приходящаяся в среднем на одного жителя отличалось от среднего по стране на 3763,49 рубдей
4. Характеристика структуры распределения
К показателям структуры, кроме медианы, также относят квартили, которые делят совокупность на четыре части, децили (10 частей) и прочие перцентили. Использование тех или иных характеристик зависит от цели исследования и от объёма изучаемой совокупности (с увеличением объёма растёт число групп). В данной работе необходимо подсчитать только медиану и квартили.
Нижний квартиль:
Верхний квартиль:
Таблица 4
Показатели структуры распределения
Показатели структуры распределения |
Значение |
Нижний квартиль |
1659,000 |
Медиана |
3658,500 |
Верхний квартиль |
5525,000 |