Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 18:57, курсовая работа
Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
провести вариационный анализ статистической совокупности;
провести бесповторную выборку, а также описать процесс ее проведения;
провести корреляционно-регрессионный анализ;
проверить гипотезу о нормальном характере распределения
провести анализ рядов динамики.
Найдем общее среднее значение:
83,75
Найдем общую дисперсию:
985,94
Для того, чтобы найти межгрупповую дисперсию, необходимо вычислить средние значения в каждой группе:
Межгрупповая дисперсия:
Из полученного значения ЭКО мы можем сделать вывод о том, то связь между факторным и результативным признаком заметная.
Т.к. Ƞ = 0,67, значит, Ƞ2 = 0,44. Это говорит о том, что вариация численности безработных на 44% обусловлена различиями численности экономически активного населения по субъектам РФ.
Исходя из полученных данных, мы можем сделать вывод о том, что связь между факторным признаком и результативным признаком – умеренная.
Задание № 5
Произвести отбор 25 и 49 регионов из общего количества по принципам выборочного наблюдения.
Для каждого способа:
Сопоставить результаты расчетов, сделать выводы относительно использования каждого вида отбора.
При проведении выборочного наблюдения и оценки параметров генеральной совокупности по выборочным данным возникают ошибки двух видов: ошибки регистрации и ошибки репрезентативности.
Рассчитать точные значения параметров генеральной совокупности невозможно, поскольку оценка выполняется по неполному множеству единиц. Но для каждой величины возможно определить интервал, в который с заданной доверительной вероятностью попадает значение этой величины. Границы интервала определяются с учетом предельной ошибки:
,
где – среднее значение признака по выборке; – предельная ошибка репрезентативности для средней величины; – среднее значение признака по генеральной совокупности.
Предельная ошибка средней величины рассчитывается по формуле:
, (25)
где – коэффициент доверия; – дисперсия признака в генеральной совокупности; – размер генеральной совокупности; – размер выборочной совокупности; – коэффициент корректировки на бесповторность.
Проведем случайную
Выборка производится из генеральной совокупности, состоящей из 81 региона РФ. Генеральная средняя равна 825,358 штук.
Проведем выборку 25 регионов РФ из 81. Далее посредством генератора случайных чисел из генеральной совокупности отберем 25 субъектов РФ (20%) - Таблица 5.1:
Таблица 5.1 – Выборочная совокупность
№ п.п. |
Наименование субъекта |
Численность |
1 |
Еврейская автономная обл. |
91 |
2 |
Республика Тыва |
129 |
3 |
Карачаево-Черкесская Республика |
209 |
4 |
Республика Хакасия |
272 |
5 |
Новгородская обл. |
345 |
6 |
Республика Северная Осетия-Алания |
372 |
7 |
Кабардино-Балкарская Республика |
403 |
8 |
Республика Мордовия |
461 |
9 |
Республика Саха (Якутия) |
491 |
10 |
Астраханская обл. |
525 |
11 |
Чеченская |
544 |
12 |
Калужская обл. |
554 |
13 |
Рязанская обл. |
569 |
14 |
Брянская обл. |
655 |
15 |
Ульяновская обл. |
676 |
16 |
Ярославская обл. |
701 |
17 |
Владимирская обл. |
775 |
18 |
Тульская обл. |
800 |
19 |
Ленинградская обл. |
915 |
20 |
Оренбургская обл. |
1109 |
21 |
Алтайский Край |
1302 |
22 |
Ставропольский край |
1364 |
23 |
Пермский край |
1441 |
24 |
Самарская обл. |
1739 |
25 |
Тюменская обл. |
1909 |
Так как объем выборки меньше 30 единиц, то такая выборка называется малой выборкой, и распределение выборочных средних значений признака не описывается нормальным законом.
Расчет предельной ошибки для случаев, когда n<30 необходимо выполнять по правилам малой выборки. Предельная ошибка малой выборки рассчитывается по формуле
, (26)
где – коэффициент доверия Стьюдента;
– выборочная дисперсия признака в малой выборке.
Осуществим расчеты:
1) Для определения предельной ошибки необходимо рассчитать выборочную дисперсию. Все промежуточные расчеты представим в табличной форме (см. приложение 4).
Подставив в формулу для
расчета дисперсии
Определим коэффициенты доверия Стьюдента. Значение коэффициента доверия Стьюдента выбирается по таблице “Распределение Стьюдента” по двум параметрам: степень значимости ( ) и число степеней свободы . Имея число степеней свободы и степени значимости ; ; ; соответственно для вероятностей ; ; , определим коэффициенты доверия Стьюдента: ; ; ; .
Подставив все рассчитанные данные в формулу предельной ошибки, получим соответственно:
Рассчитав предельные ошибки,
определим интервалы для
Таким образом, с вероятностью 64 % можно сказать, что значение генеральной средней находится в интервале [650,26 тыс. чел.; 817,82 тыс. чел.]
С вероятностью 72% можно сказать, что значение генеральной средней находится в интервале [630,52 тыс. чел.; 837,56 тыс. чел.]
С вероятностью 89% можно сказать, что значение генеральной средней находится в интервале [566,78 тыс. чел.; 901,30 тыс. чел.]
С вероятностью 93% можно сказать, что значение генеральной средней находится в интервале [566,78 тыс. чел.; 901,30 тыс. чел.]
Таким образом, полученная выборка является репрезентативной, так как значение генеральной средней попадает во все интервалы.
Таблица 5.3 – Сопоставление вероятности, -а и интервалов
Вероятность(Ft) |
Критерий доверия (tст) |
Предельная ошибка( |
Интервал | |
0,64 |
0,857 |
83,78 |
| |
0,72 |
1,059 |
1,059 |
| |
0,89 |
1,711 |
1,711 |
| |
0,93 |
1,711 |
1,711 |
|
Таким образом, чем больше
вероятность того, что генеральная
средняя попадет в
Произведем случайный бесповторный отбор 49 единиц из генеральной совокупности:
Таблица 5.4 – Отбор 49 субъектов
№ п.п. |
Наименование субъекта |
Численность |
1 |
Республика Алтай |
101 |
2 |
Камчатский край |
204 |
3 |
Республика Хакасия |
272 |
4 |
Псковская обл. |
360 |
5 |
Республика Марий Эл |
377 |
6 |
Республика Мордовия |
461 |
7 |
Калининградская обл. |
516 |
8 |
Смоленская обл. |
535 |
9 |
Калужская обл. |
554 |
10 |
Курская обл. |
589 |
11 |
Архангельнская обл. |
671 |
12 |
Ярославская обл. |
701 |
13 |
Хабаровский край |
776 |
14 |
ХМАО-Югра |
914 |
15 |
Оренбургская обл. |
1 109 |
16 |
Иркутская обл. |
1 305 |
17 |
Новосибирская обл. |
1 422 |
18 |
Самарская обл. |
1 739 |
19 |
Республика Татарстан |
2 025 |
20 |
Краснодарский край |
2 592 |
21 |
Еврейская автономная обл. |
91 |
22 |
Магаданская обл. |
103 |
23 |
Республика Калмыкия |
144 |
24 |
Карачаево-Черкесская Республика |
209 |
25 |
Республика Ингушетия |
232 |
26 |
Сахалинская обл. |
295 |
27 |
Новгородская обл. |
345 |
28 |
Костромская обл. |
368 |
29 |
Республика Карелия |
373 |
30 |
Кабардино-Балкарская Республика |
403 |
31 |
Амурская обл. |
445 |
32 |
Республика Бурятия |
469 |
33 |
Республика Саха (Якутия) |
491 |
34 |
Мурманская обл |
517 |
35 |
Забайкальский край |
532 |
36 |
Чеченская Республика |
544 |
37 |
Тамбовская обл. |
550 |
38 |
Томская обл. |
559 |
39 |
Рязанская обл. |
569 |
40 |
Липецкая обл. |
609 |
41 |
Вологодская обл. |
658 |
42 |
Ульяновская обл. |
676 |
43 |
Пензенская обл. |
683 |
44 |
Тверская обл. |
713 |
45 |
Владимирская обл. |
775 |
46 |
Белгородская обл. |
780 |
47 |
Удмуртская Республика |
833 |
48 |
Ленинградская обл. |
915 |
49 |
Приморский край |
1 081 |
итого |
32 185 |
Так как данная выборка не является малой (49 > 30), то значение критерия t для вычисления предельной ошибки выборки определяется по табличным значениям интеграла вероятностей для нормального распределения.
Так как n < 100, то значение выборочной дисперсии корректируем умножением на коэффициент n/(n-1).
Определим коэффициенты доверия Стьюдента. Имея число степеней свободы и степени значимости ; ; ; соответственно для вероятностей ; ; , определим коэффициенты доверия Стьюдента: ; ; ;
Подставив все рассчитанные данные в формулу предельной ошибки, получим соответственно:
Для определения доверительного интервала необходимо рассчитать общее среднее значение изучаемого признака в выборочной совокупности:
Рассчитаем интервалы для генеральной средней:
С вероятностью 60% что значение генеральной
средней находится в интервале [617 тыс. чел.; 697 тыс. чел];
с вероятностью 72% – в интервале [610 тыс. чел.; 704 тыс. чел.];
с вероятностью 89% – в интервале [587 тыс. чел.; 727 тыс. чел.];
с вероятностью 93 % – в интервале [577 тыс. чел.; 736 тыс. чел.].
Таблица 5.5 – Сопоставление вероятности,
Вероятность(Ft) |
Критерий доверия (tcт) |
Предельная ошибка( ) |
Интервал | |
0,64 |
0,92 |
40,19 |
| |
0,72 |
1,08 |
47,18 |
| |
0,89 |
1,6 |
69,90 |
| |
0,93 |
1,82 |
79,51 |
|
Значение генеральной средней попадает во все рассчитанные интервалы. Это свидетельствует о соответствии характеристик выборочной совокупности характеристикам генеральной совокупности с заданными вероятностями.
Таким образом, чем больше
вероятность того, что генеральная
средняя попадет в