Статистическое изучение регионов РФ

Автор работы: Пользователь скрыл имя, 15 Ноября 2014 в 21:57, курсовая работа

Описание работы

Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. Результаты группировки необходимо представить в таблице и сделать выводы.

Содержание работы

Задание №1 3
1.1 Структурная равноинтервальная группировка 4
1.2 Аналитическая группировка 7
1.3 Комбинационная группировка по признаку-фактору и признаку- результату 9
Задание № 2 10
2.1 Построение вариационных, частотных и кумулятивных рядов распределения 11
2.2 Анализ вариационных рядов 16
2.3 Проверка теоремы о разложении дисперсий 21
2.4 Корреляционное поле, уравнение регрессии, теснота связи между признаками 26
Задание №3 29
3.1 Выборочное наблюдение признака Х (площадь территории на 1 января 2009г., тыс. км. кв.) 29
3.2. Выборочное наблюдение признака Y (число ДТП на 100000 населения) 31
Задание №4 32
4.1 Динамические ряды для характеристики изменения социально-экономических показателей по районам Псковской области 33
4.2 Расчёты показателей 33
4.3 Сглаживание ряда динамики трёхлетней скользящей средней. Графическое отображение 38
4.4. Аналитическое сглаживание ряда динамики 40
4.5 Сравнительные выводы по районам и их общая характеристика развития по направлению- численность населения 44
Задание №5 45
Список использованной литературы 49

Файлы: 1 файл

статистика курс.docx

— 313.40 Кб (Скачать файл)

 

Итого:  для 1 группы = 220,9+55,1+86,6+134,3+103,8+128,0+122,1+

146,4+132,2+142,0+158,2+117,2+148,3+149,9+187,8+179,9+158,1+124,0+

147,5+98,5+156,7+167,9+147,9+157,4+127,6+116,4= 3614,7

              для 2 группы = 131,6+159,7 = 291,3

             

Рассчитаем среднее значение (на примере первой группы):

Ср. знач.= = 3614,7/26=139,03

Среднее число дорожно- транспортных происшествий на 100 000 населения: 4277,4/30 = 142,59 – ДТП на 100 000 населения.

Вывод: связи между признаками выявить не удалось, т.к. число дорожно- транспортных происшествий не зависит от площади территории. Хаотичная.

 

 

 

1.3 Комбинационная группировка по признаку-фактору и признаку- результату

Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.

План построения:

    • определить факторный и результативный признаки. Если группировка однофакторная, в наличии имеют 2 признака (один - факторный, другой - результативный);
    • определить количество групп по факторному и результативному признакам;
    • определить шаг разбиения по факторному и результативному признакам;
    • построить макет;
    • заполнить внутренние ячейки таблицы;
    • определить контрольное число и сделать вывод.

В данном случае факторный признак - это площадь территории на 1 января 2009г., тыс. км. кв., результативный - число дорожно- транспортных происшествий на 100 000 населения.

Оптимальное число групп n=6 (для факторного признака); n=4 (для результативного признака) уже определено ранее.

Шаг разбиения также высчитан в задании: для факторного признака это – 392,38, для результативного – 41,45.

 

 

 

 

 

 

 

Таблица 1.4

Связь между площадью территории регионов (тыс. км. кв.) и числом дорожно-транспортных происшествий на 100 000 населения

Группы по площади территории на 1 января 2009г.,тыс.км.кв.

Группы по числу ДТП на 100 000 населения

Итого:

55,1 – 96,55

96,55 – 138

138 – 179,45

179,45 – 220,9

12,5 – 404,88

2

10

11

3

26

404,88 – 797,26

0

1

1

0

2

797,26 – 1189,64

0

0

0

0

0

1189,64 – 1582,02

0

0

0

1

1

1582,02 – 1974,4

0

0

0

0

0

1974,4 – 2366,8

0

0

1

0

1

Итого:

2

11

13

4

30


 

Вывод: так как элементы расположены хаотично, много ячеек остались незаполненными, связи между площадью территории регионов и численностью дорожно- транспортных происшествий ( на 100 000 населения) не существует.

 

Задание № 2

1. На основе структурных  группировок из задания 1 построить  вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.

2. Проанализировать вариационные  ряды распределения, вычислив для  каждого из них:

    • среднее арифметическое значение признака;
    • медиану, квартили  и моду;
    • среднее квадратическое отклонение;
    • коэффициент вариации.

3. Проверить теорему о  разложении дисперсии, используя  данные аналитической группировки.

4. Изобразить корреляционное  поле. Построить уравнение регрессии. определить тесноту связи между  признаками, используя дисперсионный  и корреляционный анализ.

5. Сделать выводы.

 

2.1 Построение  вариационных, частотных и кумулятивных рядов распределения

Объем совокупности: N = 30.

 

Таблица 2.1

Вариационный частотный и кумулятивный ряд распределения по площади территории на 1 января 2009г.,тыс.км.кв.

Площадь территории на

1 января 2009г., тыс. км. кв.

Количество регионов в отдельной группе

Среднее значение

Показатель накопленной частоты

12,5 – 404,88

26

208,69

26

404,88 – 797,26

2

601,07

28

797,26 – 1189,64

0

993,45

28

1189,64 – 1582,02

1

1385,83

29

1582,02 – 1974,4

0

1778,21

29

1974,4 – 2366,8

1

2170,6

30

Итого:

30

-

-


 

Среднее значение (необходимо для построения полигона):

  = (на примере второй группы с показателями 404,88 – 797,26).

 

Гистограмма – столбиковая диаграмма для представления интервального ряда распределения. Строится на осях (xi; fi).

Рис. 2.1. Гистограмма вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.

 

Полигон – служит для наглядного изображения дискретного ряда. Ломаная линия, построенная на осях (xi; fi).

Рис. 2.2. Полигон по площади территории регионов на 1 января 2009г., тыс. км. кв.

 

Кумулята – ломаная линия, служащая для представления кумулятивного ряда распределения (ряда по накопленным частотам).

Строится на осях (xi; Si).

Рис. 2.3. Кумулята вариационного ряда по площади территории регионов на 1 января 2009г., тыс. км. кв.

Таблица 2.2

Вариационный частотный и кумулятивный ряд распределения по числу дорожно- транспортных происшествий на 100 000 населения

Число дорожно- транспортных происшествий на 100 000 населения

Количество регионов в отдельной группе

Среднее значение

Показатель накопленной частоты  

55,1 – 96,55

2

75,83

2

96,55 – 138

11

117,28

13

138 – 179,45

13

158,73

26

179,45 – 220,9

4

200,18

30

Итого:

30

-

-


 

Среднее значение:

  = (на примере второй группы с показателями 96,55 – 138).

 

Рис. 2.4. Гистограмма вариационного ряда по численности дорожно- транспортных происшествий на 100 000 населения

Рис. 2.5. Полигон по числу дорожно- транспортных происшествий на 100 000 населения

 

Рис. 2.6. Кумулята вариационного ряда по числу дорожно- транспортных происшествий на 100 000 населения

 

 

2.2 Анализ вариационных  рядов

 Таблица 2.3

Расчётная таблица для нахождения среднего арифметического признака, медианы ,моды, квартилей, дисперсии, среднего квадратического отклонения

Площадь территории на

1 января 2009г., тыс. км. кв.

Количество регионов в отдельной группе

Cередина интервала

Показатель накопленной частоты

12,5 – 404,88

26

208,69

5425,94

444756,52

26

404,88 – 797,26

2

601,07

1202,14

136858,66

28

797,26 – 1189,64

0

993,45

0

0

28

1189,64 – 1582,02

1

1385,83

1385,83

1094848,32

29

1582,02 – 1974,4

0

1778,21

0

0

29

1974,4 – 2366,8

1

2170,6

2170,6

3353000,45

30

Итого:

30

-

10184,51

5029463,95

-


 

9558,44 тыс. км. кв.

1) тыс.км. кв. – среднее арифметическое (взвешенное, т.к. данные сгруппированы) значение площади территории на 1 января 2009г.

2) Дисперсия (D) – средний квадрат отклонения индивидуальных значений признака от средней величины. Для вариационного ряда она определяется по формуле: D= , где

  – отдельное значение; 
- частота или частость; 
           - среднее значение.

Если ряд интервальный, то в качестве xi , так же как при расчёте средней, берется середина интервала.

Среднее квадратическое отклонение ( ) – показатель, который представляет собой квадратный корень из дисперсии. Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения и выражается в тех же единицах, что и варианты признака.

== (т.к. данные сгруппированы, необходимо использовать взвешенную формулу).

= 409,44тыс. км. кв.

3) Коэффициент вариации:

= *100%= %

102,6%60%

Вывод: так как kв больше 60%, то статистическая совокупность регионов по площади территории считается неоднородной, необходимо исключить аномальные значения.

 

4) Медиана (Ме ) – это такое значение признака, которое делит объем совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.

Численное значение медианы определяется по ряду накопленных частот.

 – условие для нахождения медианной группы.

  - первый интервал для данной группировки является медианным.

 12,5+392,38(тыс. км. кв.)

– нижняя граница интервала, содержащего медиану;

– шаг интервала, содержащего медиану;

– накопленная частота интервала, который стоит перед медианным;

– объем совокупности;

– частота того интервала, в котором расположена медиана.

Вывод: встречаются регионы со значением площади ниже 240,08 тыс. км. кв.и выше 240,08 тыс. км. кв.

     

Мода (Мо ) – наиболее часто встречающееся значение признака в совокупности.

Если ряд равноинтервальный, то используется формула:

=12,5+392,38 (тыс. км. кв.)

Вывод: чаще всего встречаются регионы с площадью 216,54 тыс. км. кв.

 

Квартили делят совокупность на 4 равные части.

 – общая формула расчёта квантилей;

 – нижняя граница интервала, содержащего квантиль;

- шаг в квантильном интервале;

iqi -индекс квартили;

Sqi-1 – накопленная частота перед данным квантильным интервалом;

fqi – частота данного квантильного интервала.

iq1=1/4

iq2 =2/4=1/2 – квартиль является медианой =(тыс. км. кв.)

iq3=3/4

100% / 4=25%

=(тыс. км. кв.)

 =(тыс. км. кв.)

=352,06 (тыс. км. кв.)

Вывод: 25% регионов имеют площадь территории в среднем менее ; 75% регионов имеют площадь территории в среднем менее 352,06 тыс. км. кв.

 

Таблица 2.4

Расчетная таблица для нахождения среднего арифметического признака, медианы, моды, квартилей, дисперсии, среднего квадратического отклонения

Число дорожно-транспортных происшествий на 100000 населения

Количество регионов в отдельной группе

Cередина интервала

Показатель накопленной частоты

55,1 – 96,55

2

75,83

151,66

9166,58

2

96,55 – 138

11

117,28

1290,08

7579,66

13

138 – 179,45

13

158,73

2063,49

3003,52

26

179,45 – 220,9

4

200,18

800,72

12836,88

30

Итого:

30

-

4305,95

32586,64

-

Информация о работе Статистическое изучение регионов РФ