Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 18:57, курсовая работа
Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
провести вариационный анализ статистической совокупности;
провести бесповторную выборку, а также описать процесс ее проведения;
провести корреляционно-регрессионный анализ;
проверить гипотезу о нормальном характере распределения
провести анализ рядов динамики.
Подставив соответствующие значения в формулы, найдем сначала центральный момент третьего порядка, а затем и асимметрию:
Вторым показателем, определяющим характер вариации, является показатель эксцесса:
где – центральный момент четвертого порядка:
Промежуточные расчеты, необходимые для нахождения центрального момента четвертого порядка и эксцесса, также представим в табличной форме “Таблица 2.6” (см. приложение 5).
Подставив полученные значения в формулы, рассчитаем центральный момент четвертого порядка и эксцесс
Ex=0,687 739 758
Исходя из рассчитанных показателей характера вариации, сделаем следующие выводы относительно исследуемой совокупности:
Таким образом, проведя вариационный анализ статистической совокупности, мы наглядно смогли представить, как распределена численность экономически активного населения по всем субъектам Российской Федерации, определили, что в данном интервальном ряду средняя численность экономически активного населения составила 825 тыс. чел., а размах вариации 2637 единиц численности, что говорит о достаточно большом разбросе индивидуальных значений.
При этом половина субъектов РФ в совокупности имеют число предприятий и организаций в количестве 627 тыс. чел. или меньше, а половина – 627 тыс. чел. или больше.
В среднем показатель отклоняется от среднего числа предприятий и организаций на 498,95 единиц численности экономически активного населения, СКО и дисперсия вариационного ряда составили, соответственно, 620,107 364 7 и 384 533,1437.
Значение всех рассчитанных показателей представлены в приложении 6.
\
Задание 3
В данном задании нужно проверить гипотезу о нормальном характере распределения Показателя, используя критерий Пирсона. Степень значимости принять равной 0,05.
Проверка гипотезы состоит в том, чтобы на основании сравнения эмпирических частот с теоретическими частотами сделать вывод о соответствии фактического распределения теоретическому.
Для проверки гипотезы о
нормальном характере распределения
можно воспользоваться
Фактическое значение вычисляется по формуле
,
где и – частота попадания признака в j-й интервал соответственно в эмпирическом и теоретическом рядах распределения; k – количество выделенных интервалов.
Эмпирическая частота появления признака берется из фактического вариационного ряда.
Теоретическая частота появления признака определяется по формуле
,
где – длина интервала;
– среднее квадратическое отклонение признака;
– плотность вероятности теоретического распределения.
Для начала рассчитаем среднее значение признака как среднюю арифметическую взвешенную, так как данные сгруппированы:
Значение среднего квадратического отклонения подставим из предыдущего задания:
Рассчитаем значение нормированного отклонения для каждого интервала и по рассчитанным значениям нормированного отклонения найдем соответствующие значения плотности вероятности нормального нормированного распределения. После чего рассчитаем значение теоретической частоты.
Интервалы |
Центр интервала |
Численность |
Нормированное отклонение t=(xi-xср)/σ |
f(t) по таблице |
Теоретическая частота f ′ |
23-373 |
198 |
18 |
-0,6 |
0,2371 |
11 |
373-723 |
548 |
31 |
0,39 |
0,3589 |
16 |
723-1073 |
898 |
8 |
1,38 |
0,397 |
18 |
1073-1423 |
1248 |
11 |
2,38 |
0,3187 |
15 |
1423-1773 |
1598 |
4 |
3,37 |
0,1972 |
9 |
1773-2123 |
1948 |
5 |
4,36 |
0,079 |
4 |
2123-2473 |
2298 |
2 |
5,35 |
0,0246 |
1 |
2473-2823 |
2648 |
2 |
6,34 |
0,0055 |
0,3 |
Итого: |
81 |
74 |
Результаты всех расчетов представим в таблице 3.1:
Таблица 3.1. – Расчет теоретических частот
Далее рассчитаем фактическое значение . Расчеты представим в виде таблицы 3.2
Таблица 3.2
– Расчет фактического
значения
Эмпирические частоты |
Теоретические частоты |
fэмп-fm |
(fэмп-fm)2 |
(fэмп-fm)2/fm |
18 |
11 |
7 |
49 |
4,455 |
31 |
16 |
15 |
225 |
14,063 |
8 |
18 |
-10 |
100 |
5,556 |
11 |
15 |
-4 |
16 |
1,067 |
4 |
9 |
-5 |
25 |
2,778 |
5 |
4 |
1 |
1 |
0,250 |
2 |
1 |
1 |
1 |
1,000 |
2 |
0,0 |
2 |
4 |
- |
∑=81 |
∑=74 |
29,167 |
Итак, =29,167. Сравнив рассчитанное и табличное значения .
Табличное значение определяется по “Распределению Пирсона” по двум входным параметрам: число степеней свободы и степени значимости . Степень значимости по условию задачи равно 0,05. число степеней свободы равно:
,
Где k – число интервалов в вариационном ряду, в нашем случае оно равно 8.
По значениям по таблице находим .
Фактическое значение оказалось больше табличного (29,167>11,070), следовательно, гипотеза о нормальном распределении предприятий и организаций не подтвердилась.
Задание № 4
Необходимо определить, с какими показателями корреляционно связан показатель «Численность экономически активного населения по субъектам РФ в 2010 году и оценить тесноту связи.
Рассмотрим две пары признаков, в каждой паре один признак является факторным, а другой результативным.
В первой паре факторный признак: Численность населения в 2010 году;
результативный: Численность экономически активного населения в 2010 году.
Между двумя признаками имеет место корреляционная связь, если с изменением значений одного признака закономерным образом изменяется среднее значение другого признака.
Необходимо определить тесноту связи между признаками, то есть провести корреляционный анализ.
Процедура корреляционного анализа включает в себя:
Построим поле корреляции по совокупности, где факторным показателем является: численность населения в 2010 году, результативным: Численность экономически активного населения в 2010 году.
Поле корреляции будет иметь следующий вид:
Рисунок 4.1 – Поле корреляции
Из поля корреляции видно, что следующие точки - Московская область (7093; 3 762) и г. Москва (11514; 6 101) - находятся на значительном удалении от общей концентрации точек совокупности, поэтому единицы, соответствующие им целесообразно признать аномальными и исключить из дальнейшего анализа.
Таким образом, поле корреляции примет следующий вид:
Рисунок 4.2 – Поле корреляции для исследования
Далее рассчитаем следующие показатели:
Построим для этого корреляционную решетку.
Таблица 4.1 – Корреляционная решетка
Численность населения, чел. |
Численность экономически активного населения, тыс. чел.
|
Итого: | |||
0-600 |
600-1100 |
1100-2000 |
2000-2700 |
||
0-2000 |
40 |
19 |
- |
- |
59 |
2000-4000 |
- |
- |
16 |
- |
16 |
4000-5500 |
- |
- |
- |
6 |
6 |
Итого: |
40 |
19 |
16 |
6 |
81 |
Рассчитаем показатели корреляции и оценим наличие и тесноту связи.
Найдем общее среднее значение:
×××827,78
Найдем общую дисперсию:
××
Для того, чтобы найти межгрупповую дисперсию, необходимо вычислить средние значения в каждой группе:
Межгрупповая дисперсия:
364239,38
ЭКО показывает тестону связи. Полученное значение указывает на то, что связь весьма тесная.
Т.к. Ƞ=0,94, то Ƞ2 = 0,88. Это говорит о том, что на 88% вариация численности экономически активного населения обусловлена различиями в общей численности населения по субъектам РФ.
Исходя из полученных данных, мы можем сделать вывод о том, что связь между факторным признаком и результативным признаком – умеренная.
2) Во второй паре факторный признак: численность экономически активного населения; результативный: численность безработных.
Построим поле корреляции по совокупности, где факторным показателем является: численность экономически активного населения, результативным: численность безработных.
Рисунок 4.3 – Поле корреляции
Из поля корреляции видно, что следующие точки - г. Москва (6 101; 104), Московская область (3 762; 126), г. Санкт-Петербург (2 660; 70) - находятся на значительном удалении от общей концентрации точек совокупности, поэтому единицы, соответствующие им целесообразно признать аномальными и исключить из дальнейшего анализа.
Таким образом, поле корреляции примет следующий вид:
Рисунок 4.4. – Поле корреляции для исследования
Построим корреляционную решетку.
Таблица 4.2 – Корреляционная решетка
Численность экономически активного населения, тыс. чел. |
Численность безработных, тыс. чел.
|
Итого: | ||
0-150 |
150-200 |
200-250 |
||
0-1000 |
56 |
- |
1 |
57 |
1000-2000 |
17 |
1 |
- |
18 |
2000-3000 |
1 |
3 |
1 |
5 |
Итог: |
74 |
4 |
2 |
80 |