Автор работы: Пользователь скрыл имя, 15 Ноября 2014 в 21:57, курсовая работа
Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. Результаты группировки необходимо представить в таблице и сделать выводы.
Задание №1 3
1.1 Структурная равноинтервальная группировка 4
1.2 Аналитическая группировка 7
1.3 Комбинационная группировка по признаку-фактору и признаку- результату 9
Задание № 2 10
2.1 Построение вариационных, частотных и кумулятивных рядов распределения 11
2.2 Анализ вариационных рядов 16
2.3 Проверка теоремы о разложении дисперсий 21
2.4 Корреляционное поле, уравнение регрессии, теснота связи между признаками 26
Задание №3 29
3.1 Выборочное наблюдение признака Х (площадь территории на 1 января 2009г., тыс. км. кв.) 29
3.2. Выборочное наблюдение признака Y (число ДТП на 100000 населения) 31
Задание №4 32
4.1 Динамические ряды для характеристики изменения социально-экономических показателей по районам Псковской области 33
4.2 Расчёты показателей 33
4.3 Сглаживание ряда динамики трёхлетней скользящей средней. Графическое отображение 38
4.4. Аналитическое сглаживание ряда динамики 40
4.5 Сравнительные выводы по районам и их общая характеристика развития по направлению- численность населения 44
Задание №5 45
Список использованной литературы 49
Итого: для 1 группы = 220,9+55,1+86,6+134,3+103,8+
146,4+132,2+142,0+158,2+117,2+
147,5+98,5+156,7+167,9+147,9+
для 2 группы = 131,6+159,7 = 291,3
Рассчитаем среднее значение (на примере первой группы):
Ср. знач.= = 3614,7/26=139,03
Среднее число дорожно- транспортных происшествий на 100 000 населения: 4277,4/30 = 142,59 – ДТП на 100 000 населения.
Вывод: связи между признаками выявить не удалось, т.к. число дорожно- транспортных происшествий не зависит от площади территории. Хаотичная.
1.3 Комбинационная группировка по признаку-фактору и признаку- результату
Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.
План построения:
В данном случае факторный признак - это площадь территории на 1 января 2009г., тыс. км. кв., результативный - число дорожно- транспортных происшествий на 100 000 населения.
Оптимальное число групп n=6 (для факторного признака); n=4 (для результативного признака) уже определено ранее.
Шаг разбиения также высчитан в задании: для факторного признака это – 392,38, для результативного – 41,45.
Таблица 1.4
Связь между площадью территории регионов (тыс. км. кв.) и числом дорожно-транспортных происшествий на 100 000 населения
Группы по площади территории на 1 января 2009г.,тыс.км.кв. |
Группы по числу ДТП на 100 000 населения |
Итого: | |||
55,1 – 96,55 |
96,55 – 138 |
138 – 179,45 |
179,45 – 220,9 | ||
12,5 – 404,88 |
2 |
10 |
11 |
3 |
26 |
404,88 – 797,26 |
0 |
1 |
1 |
0 |
2 |
797,26 – 1189,64 |
0 |
0 |
0 |
0 |
0 |
1189,64 – 1582,02 |
0 |
0 |
0 |
1 |
1 |
1582,02 – 1974,4 |
0 |
0 |
0 |
0 |
0 |
1974,4 – 2366,8 |
0 |
0 |
1 |
0 |
1 |
Итого: |
2 |
11 |
13 |
4 |
30 |
Вывод: так как элементы расположены хаотично, много ячеек остались незаполненными, связи между площадью территории регионов и численностью дорожно- транспортных происшествий ( на 100 000 населения) не существует.
Задание № 2
1. На основе структурных группировок из задания 1 построить вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.
2. Проанализировать вариационные ряды распределения, вычислив для каждого из них:
3. Проверить теорему о разложении дисперсии, используя данные аналитической группировки.
4. Изобразить корреляционное
поле. Построить уравнение регрессии.
определить тесноту связи
5. Сделать выводы.
2.1 Построение вариационных, частотных и кумулятивных рядов распределения
Объем совокупности: N = 30.
Таблица 2.1
Вариационный частотный и кумулятивный ряд распределения по площади территории на 1 января 2009г.,тыс.км.кв.
Площадь территории на 1 января 2009г., тыс. км. кв. |
Количество регионов в отдельной группе |
Среднее значение |
Показатель накопленной частоты |
12,5 – 404,88 |
26 |
208,69 |
26 |
404,88 – 797,26 |
2 |
601,07 |
28 |
797,26 – 1189,64 |
0 |
993,45 |
28 |
1189,64 – 1582,02 |
1 |
1385,83 |
29 |
1582,02 – 1974,4 |
0 |
1778,21 |
29 |
1974,4 – 2366,8 |
1 |
2170,6 |
30 |
Итого: |
30 |
- |
- |
Среднее значение (необходимо для построения полигона):
= (на примере второй группы с показателями 404,88 – 797,26).
Гистограмма – столбиковая диаграмма для представления интервального ряда распределения. Строится на осях (xi; fi).
Рис. 2.1. Гистограмма вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.
Полигон – служит для наглядного изображения дискретного ряда. Ломаная линия, построенная на осях (xi; fi).
Рис. 2.2. Полигон по площади территории регионов на 1 января 2009г., тыс. км. кв.
Кумулята – ломаная линия, служащая для представления кумулятивного ряда распределения (ряда по накопленным частотам).
Строится на осях (xi; Si).
Рис. 2.3. Кумулята вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.
Таблица 2.2
Вариационный частотный и кумулятивный ряд распределения по числу дорожно- транспортных происшествий на 100 000 населения
Число дорожно- транспортных происшествий на 100 000 населения |
Количество регионов в отдельной группе |
Среднее значение |
Показатель накопленной частоты |
55,1 – 96,55 |
2 |
75,83 |
2 |
96,55 – 138 |
11 |
117,28 |
13 |
138 – 179,45 |
13 |
158,73 |
26 |
179,45 – 220,9 |
4 |
200,18 |
30 |
Итого: |
30 |
- |
- |
Среднее значение:
= (на примере второй группы с показателями 96,55 – 138).
Рис. 2.4. Гистограмма вариационного ряда по численности дорожно- транспортных происшествий на 100 000 населения
Рис. 2.5. Полигон по числу дорожно- транспортных происшествий на 100 000 населения
Рис. 2.6. Кумулята вариационного ряда по числу дорожно- транспортных происшествий на 100 000 населения
2.2 Анализ вариационных рядов
Таблица 2.3
Расчётная таблица для нахождения среднего арифметического признака, медианы ,моды, квартилей, дисперсии, среднего квадратического отклонения
Площадь территории на 1 января 2009г., тыс. км. кв. |
Количество регионов в отдельной группе |
Cередина интервала |
Показатель накопленной частоты | ||
12,5 – 404,88 |
26 |
208,69 |
5425,94 |
444756,52 |
26 |
404,88 – 797,26 |
2 |
601,07 |
1202,14 |
136858,66 |
28 |
797,26 – 1189,64 |
0 |
993,45 |
0 |
0 |
28 |
1189,64 – 1582,02 |
1 |
1385,83 |
1385,83 |
1094848,32 |
29 |
1582,02 – 1974,4 |
0 |
1778,21 |
0 |
0 |
29 |
1974,4 – 2366,8 |
1 |
2170,6 |
2170,6 |
3353000,45 |
30 |
Итого: |
30 |
- |
10184,51 |
5029463,95 |
- |
9558,44 тыс. км. кв.
1) тыс.км. кв. – среднее арифметическое (взвешенное, т.к. данные сгруппированы) значение площади территории на 1 января 2009г.
2) Дисперсия (D) – средний квадрат отклонения индивидуальных значений признака от средней величины. Для вариационного ряда она определяется по формуле: D= , где
– отдельное
значение;
- частота или
частость;
- среднее значение.
Если ряд интервальный, то в качестве xi , так же как при расчёте средней, берется середина интервала.
Среднее квадратическое отклонение ( ) – показатель, который представляет собой квадратный корень из дисперсии. Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения и выражается в тех же единицах, что и варианты признака.
== (т.к. данные сгруппированы, необходимо использовать взвешенную формулу).
= 409,44тыс. км. кв.
3) Коэффициент вариации:
= *100%= %
102,6%60%
Вывод: так как kв больше 60%, то статистическая совокупность регионов по площади территории считается неоднородной, необходимо исключить аномальные значения.
4) Медиана (Ме ) – это такое значение признака, которое делит объем совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.
Численное значение медианы определяется по ряду накопленных частот.
– условие для нахождения медианной группы.
- первый интервал для данной группировки является медианным.
12,5+392,38(тыс. км. кв.)
– нижняя граница интервала, содержащего медиану;
– шаг интервала, содержащего медиану;
– накопленная частота интервала, который стоит перед медианным;
– объем совокупности;
– частота того интервала, в котором расположена медиана.
Вывод: встречаются регионы со значением площади ниже 240,08 тыс. км. кв.и выше 240,08 тыс. км. кв.
Мода (Мо ) – наиболее часто встречающееся значение признака в совокупности.
Если ряд равноинтервальный, то используется формула:
=12,5+392,38 (тыс. км. кв.)
Вывод: чаще всего встречаются регионы с площадью 216,54 тыс. км. кв.
Квартили делят совокупность на 4 равные части.
– общая формула расчёта квантилей;
– нижняя граница интервала, содержащего квантиль;
- шаг в квантильном интервале;
iqi -индекс квартили;
Sqi-1 – накопленная частота перед данным квантильным интервалом;
fqi – частота данного квантильного интервала.
iq1=1/4
iq2 =2/4=1/2 – квартиль является медианой =(тыс. км. кв.)
iq3=3/4
100% / 4=25%
=(тыс. км. кв.)
=(тыс. км. кв.)
=352,06 (тыс. км. кв.)
Вывод: 25% регионов имеют площадь территории в среднем менее ; 75% регионов имеют площадь территории в среднем менее 352,06 тыс. км. кв.
Таблица 2.4
Расчетная таблица для нахождения среднего арифметического признака, медианы, моды, квартилей, дисперсии, среднего квадратического отклонения
Число дорожно-транспортных происшествий на 100000 населения |
Количество регионов в отдельной группе |
Cередина интервала |
Показатель накопленной частоты | ||
55,1 – 96,55 |
2 |
75,83 |
151,66 |
9166,58 |
2 |
96,55 – 138 |
11 |
117,28 |
1290,08 |
7579,66 |
13 |
138 – 179,45 |
13 |
158,73 |
2063,49 |
3003,52 |
26 |
179,45 – 220,9 |
4 |
200,18 |
800,72 |
12836,88 |
30 |
Итого: |
30 |
- |
4305,95 |
32586,64 |
- |