Анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году

Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 18:57, курсовая работа

Описание работы

Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
провести вариационный анализ статистической совокупности;
провести бесповторную выборку, а также описать процесс ее проведения;
провести корреляционно-регрессионный анализ;
проверить гипотезу о нормальном характере распределения
провести анализ рядов динамики.

Файлы: 1 файл

kursovaya_text.docx

— 355.93 Кб (Скачать файл)

 

Найдем общее среднее  значение:

83,75

 

 

Найдем общую дисперсию:


 

985,94

 

 

Для того, чтобы найти  межгрупповую дисперсию, необходимо вычислить  средние значения в каждой группе:

 

 

 

 

Межгрупповая дисперсия:


 

 

 

 

 

Из полученного значения ЭКО мы можем сделать вывод  о том, то связь между факторным  и результативным признаком заметная.

Т.к. Ƞ = 0,67, значит, Ƞ2 = 0,44. Это говорит о том, что вариация численности безработных на 44% обусловлена различиями численности экономически активного населения по субъектам РФ.

 

Исходя из полученных данных, мы можем сделать вывод о том, что связь между факторным  признаком и результативным признаком – умеренная.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание № 5

Произвести отбор 25 и 49 регионов из общего количества по принципам  выборочного наблюдения.

Для каждого способа:

  • Описать процедуру проведения выборки;
  • Представить список выборочной совокупности;
  • Рассчитать выборочную среднюю и генеральную среднюю;
  • Рассчитать доверительный интервал генеральной средней по выборочным данным с вероятностью (0,64; 0,72; 0,89; 0,93);

Сопоставить результаты расчетов, сделать выводы относительно использования  каждого вида отбора.

При проведении выборочного  наблюдения и оценки параметров генеральной  совокупности по выборочным данным возникают  ошибки двух видов: ошибки регистрации  и ошибки репрезентативности.

Рассчитать точные значения параметров генеральной совокупности невозможно, поскольку оценка выполняется  по неполному множеству единиц. Но для каждой величины возможно определить интервал, в который с заданной доверительной вероятностью попадает значение этой величины. Границы интервала  определяются с учетом предельной ошибки:

,                      

где – среднее значение признака по выборке; – предельная ошибка репрезентативности для средней величины; – среднее значение признака по генеральной совокупности.

Предельная ошибка средней  величины рассчитывается по формуле:

,                         (25) 

где – коэффициент доверия; – дисперсия признака в генеральной совокупности; – размер генеральной совокупности; – размер выборочной совокупности; – коэффициент корректировки на бесповторность.

Проведем случайную бесповторную выборку и осуществим необходимые  расчеты.

Выборка производится из генеральной совокупности, состоящей из 81 региона РФ. Генеральная средняя равна 825,358 штук.

Проведем выборку 25 регионов РФ из 81. Далее посредством генератора случайных чисел из генеральной совокупности отберем 25 субъектов РФ (20%)  - Таблица 5.1:

Таблица 5.1 – Выборочная совокупность

№ п.п.

Наименование субъекта

Численность

1

Еврейская автономная обл.

91

2

Республика Тыва

129

3

Карачаево-Черкесская Республика

209

4

Республика Хакасия

272

5

Новгородская обл.

345

6

Республика Северная Осетия-Алания

372

7

Кабардино-Балкарская Республика

403

8

Республика Мордовия

461

9

Республика Саха (Якутия)

491

10

Астраханская обл.

525

11

Чеченская

Республика


544

12

Калужская обл.

554

13

Рязанская обл.

569

14

Брянская обл.

655

15

Ульяновская обл.

676

16

Ярославская обл.

701

17

Владимирская обл.

775

18

Тульская обл.

800

19

Ленинградская обл.

915

20

Оренбургская обл.

1109

21

Алтайский Край

1302

22

Ставропольский край

1364

23

Пермский край

1441

24

Самарская обл.

1739

25

Тюменская обл.

1909


 

Так как объем выборки  меньше 30 единиц, то такая выборка  называется малой выборкой, и распределение  выборочных средних значений признака не описывается нормальным законом.

Расчет предельной ошибки для случаев, когда n<30 необходимо выполнять по правилам малой выборки. Предельная ошибка малой выборки рассчитывается по формуле

,                         (26) 

где – коэффициент доверия Стьюдента;

 – выборочная дисперсия  признака в малой выборке.

Осуществим расчеты:

1) Для определения предельной ошибки необходимо рассчитать выборочную дисперсию. Все промежуточные расчеты представим в табличной форме (см. приложение 4).

 

 

Подставив в формулу для  расчета дисперсии промежуточные  данные, получим:

 

Определим коэффициенты доверия  Стьюдента. Значение коэффициента доверия  Стьюдента выбирается по таблице  “Распределение Стьюдента” по двум параметрам: степень значимости ( ) и число степеней свободы . Имея число степеней свободы и степени значимости ; ; ; соответственно для вероятностей ; ; , определим коэффициенты доверия Стьюдента: ; ; ; .

Подставив все рассчитанные данные в формулу предельной ошибки, получим соответственно:

    1. ; ; ;
    2. Для определения доверительного интервала необходимо рассчитать общее среднее значение изучаемого признака в выборочной совокупности:

Рассчитав предельные ошибки, определим интервалы для генеральной  средней:

 

Таким образом, с вероятностью 64 % можно сказать, что значение генеральной средней находится в интервале [650,26 тыс. чел.; 817,82 тыс. чел.]

 

С вероятностью 72% можно сказать, что значение генеральной средней находится в интервале [630,52  тыс. чел.; 837,56 тыс. чел.]

 
         

    

 

С вероятностью 89% можно сказать, что значение генеральной средней находится в интервале [566,78 тыс. чел.; 901,30 тыс. чел.]

С вероятностью 93% можно сказать, что значение генеральной средней находится в интервале [566,78 тыс. чел.; 901,30 тыс. чел.]

 

Таким образом, полученная выборка  является репрезентативной, так как  значение генеральной средней попадает во все интервалы.

Таблица 5.3 – Сопоставление вероятности, -а и интервалов

Вероятность(Ft)

Критерий  доверия (tст)

Предельная ошибка(

)

Интервал

0,64

0,857

83,78

0,72

1,059

1,059

0,89

1,711

1,711

0,93

1,711

1,711


 

Таким образом, чем больше вероятность того, что генеральная  средняя попадет в доверительный  интервал, тем шире должны быть границы  этого интервала. Это правило используется для того, чтобы генеральная средняя гарантировано попала в доверительный интервал.

Произведем случайный бесповторный отбор 49 единиц из генеральной совокупности:

Таблица 5.4 – Отбор 49 субъектов

№ п.п.

Наименование субъекта

Численность

1

Республика Алтай

101

2

Камчатский край

204

3

Республика Хакасия

272

4

Псковская обл.

360

5

Республика Марий Эл

377

6

Республика Мордовия

461

7

Калининградская обл.

516

8

Смоленская обл.

535

9

Калужская обл.

554

10

Курская обл.

589

11

Архангельнская обл.

671

12

Ярославская обл.

701

13

Хабаровский край

776

14

ХМАО-Югра

914

15

Оренбургская обл.

1 109

16

Иркутская обл.

1 305

17

Новосибирская обл.

1 422

18

Самарская обл.

1 739

19

Республика Татарстан

2 025

20

Краснодарский край

2 592

21

Еврейская автономная обл.

91

22

Магаданская обл.

103

23

Республика Калмыкия

144

24

Карачаево-Черкесская Республика

209

25

Республика Ингушетия

232

26

Сахалинская обл.

295

27

Новгородская обл.

345

28

Костромская обл.

368

29

Республика Карелия

373

30

Кабардино-Балкарская Республика

403

31

Амурская обл.

445

32

Республика Бурятия

469

33

Республика Саха (Якутия)

491

34

Мурманская обл

517

35

Забайкальский край

532

36

Чеченская Республика

544

37

Тамбовская обл.

550

38

Томская обл.

559

39

Рязанская обл.

569

40

Липецкая обл.

609

41

Вологодская обл.

658

42

Ульяновская обл.

676

43

Пензенская обл.

683

44

Тверская обл.

713

45

Владимирская обл.

775

46

Белгородская обл.

780

47

Удмуртская Республика

833

48

Ленинградская обл.

915

49

Приморский край

1 081

 

итого

32 185


 

Так как данная выборка не является малой (49 > 30), то значение критерия t для вычисления предельной ошибки выборки определяется по табличным значениям интеграла вероятностей  для нормального распределения.

Так как n < 100, то значение выборочной дисперсии корректируем умножением на коэффициент n/(n-1).

 

Определим коэффициенты доверия  Стьюдента. Имея число степеней свободы  и степени значимости ; ; ; соответственно для вероятностей  ; ; , определим коэффициенты доверия Стьюдента: ; ; ;

Подставив все рассчитанные данные в формулу предельной ошибки, получим соответственно:

;
;
;

Для определения доверительного интервала необходимо рассчитать общее  среднее значение изучаемого признака в выборочной совокупности:

Рассчитаем интервалы  для генеральной средней:

С вероятностью 60% что значение генеральной

средней находится в интервале [617 тыс. чел.; 697 тыс. чел];

с вероятностью 72% – в интервале [610 тыс. чел.; 704 тыс. чел.];

с вероятностью 89% – в интервале [587 тыс. чел.; 727 тыс. чел.];

с вероятностью 93 % – в интервале [577 тыс. чел.; 736 тыс. чел.].

 

Таблица 5.5 – Сопоставление вероятности,

-а и интервалов

Вероятность(Ft)

Критерий  доверия (tcт)

Предельная ошибка( )

Интервал

0,64

0,92

40,19

0,72

1,08

47,18

0,89

1,6

69,90

0,93

1,82

79,51


 

Значение генеральной  средней попадает во все рассчитанные интервалы. Это свидетельствует  о соответствии характеристик выборочной совокупности характеристикам генеральной  совокупности с заданными вероятностями.

Таким образом, чем больше вероятность того, что генеральная  средняя попадет в доверительный  интервал, тем шире должны быть границы  этого интервала. Это правило  используется для того, чтобы генеральная  средняя гарантировано попала в  доверительный интервал.

Информация о работе Анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году