Анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году

Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 18:57, курсовая работа

Описание работы

Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
провести вариационный анализ статистической совокупности;
провести бесповторную выборку, а также описать процесс ее проведения;
провести корреляционно-регрессионный анализ;
проверить гипотезу о нормальном характере распределения
провести анализ рядов динамики.

Файлы: 1 файл

kursovaya_text.docx

— 355.93 Кб (Скачать файл)

Подставив соответствующие  значения в формулы, найдем сначала  центральный момент третьего порядка, а затем и асимметрию:

285 730 450,6

1,198 273 233

Вторым показателем, определяющим характер вариации, является показатель эксцесса:

   


где – центральный момент четвертого порядка:

     


Промежуточные расчеты, необходимые  для нахождения центрального момента  четвертого порядка и эксцесса, также  представим в табличной форме “Таблица 2.6” (см. приложение 5).

 

Подставив полученные значения в формулы, рассчитаем центральный  момент четвертого порядка и эксцесс

 545 290 363 187,00

Ex=0,687 739 758

Исходя из рассчитанных показателей  характера вариации, сделаем следующие  выводы относительно исследуемой совокупности:

    • так как коэффициент асимметрии принимает положительные значения, то в распределении признака имеет место правосторонняя асимметрия, то есть основная масса значений признака смещена в область малых значений.
    • так как показатель эксцесса принимает положительные значения, то распределение признака является островершинным, то есть основная масса значений сконцентрирована на небольшом диапазоне изменения признака, сконцентрирована в большей степени, чем в случае нормального распределения.

Таким образом, проведя вариационный анализ статистической совокупности, мы наглядно смогли представить, как  распределена численность экономически активного населения по всем субъектам Российской Федерации, определили, что в данном интервальном ряду средняя численность экономически активного населения составила 825 тыс. чел., а размах вариации 2637 единиц численности, что говорит о достаточно большом разбросе индивидуальных значений.

При этом половина субъектов  РФ в совокупности имеют число  предприятий и организаций в  количестве 627 тыс. чел. или меньше, а половина – 627 тыс. чел. или больше.

В среднем показатель отклоняется  от среднего числа предприятий и  организаций на 498,95 единиц численности экономически активного населения, СКО и дисперсия вариационного ряда составили, соответственно, 620,107 364 7 и 384 533,1437.

Значение всех рассчитанных показателей представлены в приложении 6.

 

 

 

 

 

 

 

 

 

 

 

 

\

 

Задание 3

В данном задании нужно  проверить гипотезу о нормальном характере распределения Показателя, используя критерий Пирсона. Степень значимости принять равной 0,05.

Проверка гипотезы состоит  в том, чтобы на основании сравнения эмпирических частот с теоретическими частотами сделать вывод о соответствии фактического распределения теоретическому.

Для проверки гипотезы о  нормальном характере распределения  можно воспользоваться критерием  согласия Пирсона. Идея критерия Пирсона  заключается в расчете и оценке обобщенного показателя отклонений фактических значений частоты появления  признака от их теоретических значений (показателя ). Чем больше величина этих отклонений, тем меньше оснований считать распределений близким к теоретическому.

Фактическое значение вычисляется по формуле

  ,   


где и – частота попадания признака в j-й интервал соответственно в эмпирическом и теоретическом рядах распределения; k – количество выделенных интервалов.

Эмпирическая частота  появления признака берется из фактического вариационного ряда.

Теоретическая частота  появления признака определяется по формуле

 


где – длина интервала;

 – среднее квадратическое  отклонение признака;

 – плотность вероятности  теоретического распределения.

Для начала рассчитаем среднее  значение признака как среднюю арифметическую взвешенную, так как данные сгруппированы:

833

Значение среднего квадратического  отклонения подставим из предыдущего  задания:

620,1

Рассчитаем значение нормированного отклонения для каждого интервала  и по рассчитанным значениям нормированного отклонения найдем соответствующие  значения плотности вероятности  нормального нормированного распределения. После чего рассчитаем значение теоретической частоты.

 

 

 

 

 

 

 

Интервалы

Центр интервала

Численность

Нормированное отклонение t=(xi-xср)/σ

f(t) по таблице

Теоретическая частота f ′

23-373

198

18

-0,6

0,2371

11

373-723

548

31

0,39

0,3589

16

723-1073

898

8

1,38

0,397

18

1073-1423

1248

11

2,38

0,3187

15

1423-1773

1598

4

3,37

0,1972

9

1773-2123

1948

5

4,36

0,079

4

2123-2473

2298

2

5,35

0,0246

1

2473-2823

2648

2

6,34

0,0055

0,3

Итого:

 

81

   

74





Результаты всех расчетов представим в таблице 3.1:

Таблица 3.1. – Расчет теоретических  частот

Далее рассчитаем фактическое  значение . Расчеты представим в виде таблицы 3.2

Таблица 3.2 – Расчет фактического значения

Эмпирические  частоты

Теоретические частоты

fэмп-fm

(fэмп-fm)2

(fэмп-fm)2/fm

18

11

7

49

4,455

31

16

15

225

14,063

8

18

-10

100

5,556

11

15

-4

16

1,067

4

9

-5

25

2,778

5

4

1

1

0,250

2

1

1

1

1,000

2

0,0

2

4

-

∑=81

∑=74

   

29,167


 

Итак, =29,167. Сравнив рассчитанное и табличное значения .

Табличное значение определяется по “Распределению Пирсона” по двум входным параметрам: число степеней свободы и степени значимости . Степень значимости по условию задачи равно 0,05. число степеней свободы равно:


,   

Где k – число интервалов в вариационном ряду, в нашем случае оно равно 8.

По значениям  по таблице находим .

Фактическое значение оказалось  больше табличного  (29,167>11,070), следовательно, гипотеза о нормальном распределении предприятий и организаций не подтвердилась.

 

 

 

 

 

 

 

 

 

 

 

Задание № 4

Необходимо определить, с  какими показателями корреляционно  связан показатель «Численность экономически активного населения по субъектам РФ в 2010 году и оценить тесноту связи.

Рассмотрим две пары признаков, в каждой паре один признак является факторным, а другой результативным.

В первой паре факторный  признак: Численность населения  в 2010 году;

результативный: Численность  экономически активного населения  в 2010 году.

Между двумя признаками имеет  место корреляционная связь, если с  изменением значений одного признака закономерным образом изменяется среднее  значение другого признака.

Необходимо определить тесноту связи между признаками, то есть провести корреляционный анализ.

Процедура корреляционного  анализа включает в себя:

    1. построение поля корреляции;
    2. построение корреляционной решетки;
    3. расчет показателей корреляции;
    4. анализ и оценку наличия, направления и тесноты корреляционной связи.

Построим поле корреляции по совокупности, где факторным показателем  является: численность населения в 2010 году, результативным: Численность экономически активного населения в 2010 году.

 

 

 

Поле корреляции будет  иметь следующий вид:

Рисунок 4.1 – Поле корреляции

Из поля корреляции видно, что следующие точки  - Московская область (7093; 3 762) и г. Москва (11514; 6 101) - находятся на значительном удалении от общей концентрации точек совокупности, поэтому единицы, соответствующие им целесообразно признать аномальными и исключить из дальнейшего анализа.

 

 

 

 

 

 

 

 

 

Таким образом, поле корреляции примет следующий вид:

Рисунок 4.2 – Поле корреляции для исследования


Далее рассчитаем следующие показатели:

  • Эмпирическое корреляционное отношение (ЭКО)
  • Коэффициент детерминации

Построим для этого  корреляционную решетку.

Таблица 4.1 – Корреляционная решетка

Численность населения, чел.

 

 

Численность экономически активного  населения, тыс. чел.

 

 

 

 

Итого:

0-600

600-1100

1100-2000

2000-2700

 

0-2000

40

19

-

-

59

2000-4000

-

-

16

-

16

4000-5500

-

-

-

6

6

Итого:

40

19

16

6

81


 

 

 

Рассчитаем показатели корреляции и оценим наличие и тесноту  связи.

Найдем общее среднее  значение:


 

×××827,78

 

Найдем общую дисперсию:


 

××

 

 

Для того, чтобы найти  межгрупповую дисперсию, необходимо вычислить  средние значения в каждой группе:

 

 

 

Межгрупповая дисперсия:


 

 

364239,38

 

 

ЭКО показывает тестону связи. Полученное значение указывает на то, что связь весьма тесная.

Т.к. Ƞ=0,94, то Ƞ2 = 0,88. Это говорит о том, что на 88% вариация численности экономически активного населения обусловлена различиями в общей численности населения по субъектам РФ.

Исходя из полученных данных, мы можем сделать вывод о том, что связь между факторным признаком и результативным признаком – умеренная.

2) Во второй паре факторный признак: численность экономически активного населения; результативный: численность безработных.

Построим поле корреляции по совокупности, где факторным показателем  является: численность экономически активного населения,  результативным: численность безработных.

Рисунок 4.3 – Поле корреляции

Из поля корреляции видно, что следующие точки - г. Москва (6 101; 104), Московская область (3 762; 126), г. Санкт-Петербург (2 660; 70) - находятся на значительном удалении от общей концентрации точек совокупности, поэтому единицы, соответствующие им целесообразно признать аномальными и исключить из дальнейшего анализа.

Таким образом, поле корреляции примет следующий вид:

Рисунок 4.4. – Поле корреляции для исследования

 

 

Построим корреляционную решетку.

Таблица 4.2 – Корреляционная решетка

Численность экономически активного  населения, тыс. чел.

Численность безработных, тыс. чел.

 

 

Итого:

0-150

150-200

200-250

 

0-1000

56

-

1

57

1000-2000

17

1

-

18

2000-3000

1

3

1

5

Итог:

74

4

2

80

Информация о работе Анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году