Статистика естественного движения населения Амурской области

Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 16:50, курсовая работа

Описание работы

Целью курсовой работы является закрепление и углубление теоретических знаний, полученных при изучении дисциплины «статистика», приобретение практических навыков статистического анализа естественного движения населения в Амурской области.
В процессе выполнения курсовой работы будут решены следующие задачи:
•изучить общие основы статистической науки и основные этапы статистического исследования (статистическое наблюдение, сводка, группировка, расчет обобщающих показателей), индексный метод анализа, основы регрессионного и корреляционного анализа;
•овладеть техникой расчета системы показателей анализа естественного движения населения в Амурской области, включая методологию расчета показателей и научиться анализировать статистические данные и формулировать выводы, вытекающие из анализа.

Содержание работы

Введение 4
1 Теоретические основы статистического изучения естественного движения населения 7
1.1 Население как объект статистического изучения. Изучение естественного движения населения 7
1.2 Система показателей естественного движения населения 11
2 Статистический анализ естественного движения населения Амурской области за 2000-2009 годы 15
2.1 Анализ динамики естественного движения населения Амурской области за 2000-2009 годы 15
2.2 Анализ структуры естественного движения населения Амурской области за 2000-2009 годы 25
2.3 Группировка городов и районов Амурской области по естественному движению населения 28
2.4 Анализ естественного движения населения с помощью средних величин и показателей вариации 32
2.5 Корреляционно-регрессионный анализ естественного движения населения Амурской области за 2000-2009 годы 37
2.6 Расчет и анализ показателей населения Амурской области за 2000-2009 годы 45
Заключение 53
Библиографический список 56

Файлы: 1 файл

курсовая по статистике.doc

— 1.22 Мб (Скачать файл)

 – частота медианного интервала.

Основным этапом в  изучении вариационных рядов является расчет показателей размера и  интенсивности вариации. Для характеристики размера вариации в статистике применяются абсолютные показатели вариации: размах вариации , среднее линейное отклонение , среднее квадратическое отклонение, дисперсия, коэффициент вариации. Расчеты производятся по следующим формулам.

Размах вариации (амплитуда колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:

 

 (22)

 

.

На основании таблицы 10 рассчитаем остальные показатели вариации.

Таблица 10 – Расчетная таблица для вычисления показателей вариации среднего линейного отклонения и дисперсии

Группы городов и  районов Амурской области по естественному  движению населения, чел.

Число муниципальных  образований в абсолютном выражении, ед.

Расчетные показатели

 

(-253)  -  (-182,4)

2

-218

-436

-173

-346

29929

59858

(-182,4)  -  (-111,8)

3

-147

-441

-102

-306

10404

31212

(-111,8)  -  (-41,2)

10

-77

-770

-32

-320

1024

10240

(-41,2)  -  (29,4)

9

-6

-54

39

351

1521

13689

(29,4)  -  (100)

4

65

260

110

440

12100

48400

(100)  -  (171)

1

136

136

181

181

32761

32761

Итого

29

-

-1305

-

0

87739

196160


 

Среднее линейное и среднее  квадратическое отклонения показывают, на сколько в среднем величина изучаемого признака у отдельных  единиц совокупности отличается от среднего значения признака в совокупности.

 

(взвешенное) (23)

 

.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Формула расчета  дисперсии следующая:

 

(взвешенная) (24)

 

где – значение признака;

 – частота признака.

Если извлечь из дисперсии  корень второй степени получится  среднее квадратическое отклонение :

 

 (25)

 

.

Для оценки интенсивности  вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации. Наиболее часто применяют коэффициент вариации , который представляет собой процентное отношение среднего квадратического отклонения к средней арифметической:

 

 (26)

 

.

2.5 Корреляционно-регрессионный  анализ естественного движения  населения Амурской области за 2000-2009 годы

Прежде чем приступить к проведению корреляционно-регрессионного анализа естественного движения населения Амурской области за 2000-2009 годы необходимо выбрать факторный признак. Исходя из данных таблицы 1 изобразим результативный (y) и факторный признаки (x) графически.

Рисунок 7 – График корреляции между переменными x и y

 

Линия тренда и расположение точек на графике наглядно показывают, что корреляционная связь между факторным и результативным признаками линейная обратная.

Далее рассчитаем линейный коэффициент корреляции , построим линейное регрессионное уравнение. После построения уравнения регрессии вида построим второй график зависимости теоретических значений от факторного признака – . Вычислим показатели тесноты связи: теоретическое корреляционное отношение , коэффициент детерминации , индекс корреляции . Далее проверим адекватность регрессионной модели и коэффициента корреляции.

При статистическом изучении корреляционной связи определяется влияние учтенных факторных признаков на результативный признак при отвлечении от прочих аргументов. Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака на результативный признак .

В основу выявления и  установления аналитической формы  связи положено применение в анализе  исходной информации математических функций. При анализе прямолинейной зависимости применяется уравнение:

 

 (27)

 

где и – параметры уравнения регрессии.

.

Для определения формы  корреляционной связи необходимо вычислить  параметры уравнения прямой путем решения системы нормальных уравнений вида:

 

 (28)

 

 

 

Для того чтобы заполнить  систему нормальных уравнений фактическими данными, необходимо определить , , .

Расчеты этих показателей  представим по форме таблицы 11.

 

Таблица 11 – Расчет сумм для вычисления параметров уравнения прямой по несгруппированным данным

x

y

x2

y2

xy

yx

(y-yx)

(y-yx)2

1

-4099

13532

16801801

183115024

-55467668

14514

-982

964078

2

-3978

13973

15824484

195244729

-55584594

14428

-455

206919

3

-4106

14574

16859236

212401476

-59840844

14519

55

3040

4

-3774

14871

14243076

221146641

-56123154

14283

588

345859

5

-4268

15288

18215824

233722944

-65249184

14634

654

427820

6

-4300

14959

18490000

223771681

-64323700

14657

302

91331

7

-3244

13635

10523536

185913225

-44231940

13906

-271

73492

8

-1523

12479

2319529

155725441

-19005517

12683

-204

41666

9

-1881

13099

3538161

171583801

-24639219

12938

161

25979

10

-1232

12629

1517824

159491641

-15558928

12476

153

23339

Итого

-32405

139039

118333471

1942116603

-460024748

139037

2

2203522


 

Параметры и можно исчислить по формулам:

 

, (29)

 

. (30)

 

.

.

На основании уравнения регрессии построим график зависимости теоретических значений от факторного признака .

Рисунок 8 – График зависимости теоретических значений

от факторного признака

 

Отклонения от средних  по одной и другой переменным лежат  в основе измерения корреляционной связи. Для того чтобы измерить тесноту корреляционной связи между факторным и результативным признаками воспользуемся линейным коэффициентом корреляции . Если знаки отклонений от средних совпадают, то связь прямая , если знаки отклонений не совпадают, то связь обратная . По абсолютной величине чем ближе значение к единице, тем теснее связь, чем ближе значение к нулю, тем слабее связь.

 

 (31)

 

.

Полученное значение коэффициента корреляции показывает, что связь между естественной убылью населения и смертностью является обратной и весьма тесной.

Для расчета теоретического корреляционного отношения  необходимо предварительно вычислить дисперсии по формулам 33 – 35.

Соотношение между факторной  и общей дисперсиями характеризует меру тесноты связи между признаками и : . Показатель называется индексом детерминации. Он выражает долю факторной дисперсии в общей дисперсии, т.е. характеризует, какая часть общей вариации результативного признака объясняется изучаемым фактором . На основе формулы индекса детерминации определяется теоретическое корреляционное отношение :

 (32)

 

.

Общая дисперсия отображает совокупное влияние всех факторов:

 

 (33)

 

.

Остаточная дисперсия  отображает вариацию результативного  признака от всех прочих, кроме , факторов:

 

 (34)

 

.

Факторная дисперсия отображает вариацию только от воздействия изучаемого фактора :

 

 (35)

 

.

Индекс корреляционной связи вычисляется по формуле 36. Эта формула является основным алгоритмом для определения индекса корреляции с использованием машинной обработки анализируемых данных.

 

 (36)

 

.

Частный коэффициент  эластичности вычисляется по формуле:

 

 (37)

 

где – параметр при признаке-факторе;

, – средние значения факторного и результативного признаков.

; ; .

.

Адекватность регрессионной  модели при малой выборке можно оценить критерием Фишера:

 

, (38)

 

где – число параметров модели;

 – число единиц наблюдения.

.

Эмпирическое значение критерия сравнивается с критическим  или табличным значением с  уровнем значимости 0,01 или 0,05 и числом степеней свободы , . Если эмпирическое значение критерия больше табличного значения, то уравнение регрессии признается значимым (адекватным).

При уровне значимости 0,01 и 0,05 и числом степеней свободы 1 и 8 табличное значение критерия Фишера равно 5981 и 238,9, а расчетное значение равно 24,4, т.к. в первом и во втором случаях расчетное значение меньше табличного, следовательно, уравнение регрессии признается не адекватным.

Значимость коэффициентов  линейного уравнения регрессии оценивается с помощью критерия Стьюдента:

 

 (39)

 

.

 

 (40)

 

.

 

 (41)

 

.

Эмпирическое значение t-критерия сравнивается с критическим или табличным значением t-распределения Стьюдента с уровнем значимости 0,01 или 0,05 и числом степеней свободы . Параметр признается значимым, если эмпирическое значение t больше табличного.

При уровне значимости 0,01 и числом степеней свободы 8 табличное значение t-распределения Стъюдента равно 3,3554, а расчетное значение – 69,90, т.к. расчетное значение больше табличного, следовательно, параметр признается значимым. При уровне значимости 0,05 и числом степеней свободы 8 табличное значение t-распределения Стъюдента равно 2,3060, а расчетное значение – 4,94, т.к. расчетное значение больше табличного, следовательно, параметр признается значимым.

Аналогично проводится оценка коэффициента корреляции с помощью t-критерия:

 

 (42)

 

где – число степеней свободы.

.

Если эмпирическое значение t критерия оказывается больше табличного, то линейный коэффициент корреляции признается значимым.

Информация о работе Статистика естественного движения населения Амурской области