Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 16:50, курсовая работа
Целью курсовой работы является закрепление и углубление теоретических знаний, полученных при изучении дисциплины «статистика», приобретение практических навыков статистического анализа естественного движения населения в Амурской области.
В процессе выполнения курсовой работы будут решены следующие задачи:
•изучить общие основы статистической науки и основные этапы статистического исследования (статистическое наблюдение, сводка, группировка, расчет обобщающих показателей), индексный метод анализа, основы регрессионного и корреляционного анализа;
•овладеть техникой расчета системы показателей анализа естественного движения населения в Амурской области, включая методологию расчета показателей и научиться анализировать статистические данные и формулировать выводы, вытекающие из анализа.
Введение 4
1 Теоретические основы статистического изучения естественного движения населения 7
1.1 Население как объект статистического изучения. Изучение естественного движения населения 7
1.2 Система показателей естественного движения населения 11
2 Статистический анализ естественного движения населения Амурской области за 2000-2009 годы 15
2.1 Анализ динамики естественного движения населения Амурской области за 2000-2009 годы 15
2.2 Анализ структуры естественного движения населения Амурской области за 2000-2009 годы 25
2.3 Группировка городов и районов Амурской области по естественному движению населения 28
2.4 Анализ естественного движения населения с помощью средних величин и показателей вариации 32
2.5 Корреляционно-регрессионный анализ естественного движения населения Амурской области за 2000-2009 годы 37
2.6 Расчет и анализ показателей населения Амурской области за 2000-2009 годы 45
Заключение 53
Библиографический список 56
– частота медианного
Основным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации. Для характеристики размера вариации в статистике применяются абсолютные показатели вариации: размах вариации , среднее линейное отклонение , среднее квадратическое отклонение, дисперсия, коэффициент вариации. Расчеты производятся по следующим формулам.
Размах вариации (амплитуда колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:
(22)
.
На основании таблицы 10 рассчитаем остальные показатели вариации.
Таблица 10 – Расчетная таблица для вычисления показателей вариации среднего линейного отклонения и дисперсии
Группы городов и
районов Амурской области по естественному
движению населения, чел. |
Число муниципальных
образований в абсолютном выражении, ед. |
Расчетные показатели | |||||
(-253) - (-182,4) |
2 |
-218 |
-436 |
-173 |
-346 |
29929 |
59858 |
(-182,4) - (-111,8) |
3 |
-147 |
-441 |
-102 |
-306 |
10404 |
31212 |
(-111,8) - (-41,2) |
10 |
-77 |
-770 |
-32 |
-320 |
1024 |
10240 |
(-41,2) - (29,4) |
9 |
-6 |
-54 |
39 |
351 |
1521 |
13689 |
(29,4) - (100) |
4 |
65 |
260 |
110 |
440 |
12100 |
48400 |
(100) - (171) |
1 |
136 |
136 |
181 |
181 |
32761 |
32761 |
Итого |
29 |
- |
-1305 |
- |
0 |
87739 |
196160 |
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем величина изучаемого признака у отдельных единиц совокупности отличается от среднего значения признака в совокупности.
(взвешенное) (23)
.
Дисперсия представляет
собой средний квадрат
(взвешенная) (24)
где – значение признака;
– частота признака.
Если извлечь из дисперсии корень второй степени получится среднее квадратическое отклонение :
(25)
.
Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации. Наиболее часто применяют коэффициент вариации , который представляет собой процентное отношение среднего квадратического отклонения к средней арифметической:
(26)
.
Прежде чем приступить к проведению корреляционно-регрессионного анализа естественного движения населения Амурской области за 2000-2009 годы необходимо выбрать факторный признак. Исходя из данных таблицы 1 изобразим результативный (y) и факторный признаки (x) графически.
Рисунок 7 – График корреляции между переменными x и y
Линия тренда и расположение точек на графике наглядно показывают, что корреляционная связь между факторным и результативным признаками линейная обратная.
Далее рассчитаем линейный коэффициент корреляции , построим линейное регрессионное уравнение. После построения уравнения регрессии вида построим второй график зависимости теоретических значений от факторного признака – . Вычислим показатели тесноты связи: теоретическое корреляционное отношение , коэффициент детерминации , индекс корреляции . Далее проверим адекватность регрессионной модели и коэффициента корреляции.
При статистическом изучении корреляционной связи определяется влияние учтенных факторных признаков на результативный признак при отвлечении от прочих аргументов. Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака на результативный признак .
В основу выявления и установления аналитической формы связи положено применение в анализе исходной информации математических функций. При анализе прямолинейной зависимости применяется уравнение:
(27)
где и – параметры уравнения регрессии.
.
Для определения формы корреляционной связи необходимо вычислить параметры уравнения прямой путем решения системы нормальных уравнений вида:
(28)
Для того чтобы заполнить систему нормальных уравнений фактическими данными, необходимо определить , , .
Расчеты этих показателей представим по форме таблицы 11.
Таблица 11 – Расчет сумм для вычисления параметров уравнения прямой по несгруппированным данным
№ |
x |
y |
x2 |
y2 |
xy |
yx |
(y-yx) |
(y-yx)2 |
1 |
-4099 |
13532 |
16801801 |
183115024 |
-55467668 |
14514 |
-982 |
964078 |
2 |
-3978 |
13973 |
15824484 |
195244729 |
-55584594 |
14428 |
-455 |
206919 |
3 |
-4106 |
14574 |
16859236 |
212401476 |
-59840844 |
14519 |
55 |
3040 |
4 |
-3774 |
14871 |
14243076 |
221146641 |
-56123154 |
14283 |
588 |
345859 |
5 |
-4268 |
15288 |
18215824 |
233722944 |
-65249184 |
14634 |
654 |
427820 |
6 |
-4300 |
14959 |
18490000 |
223771681 |
-64323700 |
14657 |
302 |
91331 |
7 |
-3244 |
13635 |
10523536 |
185913225 |
-44231940 |
13906 |
-271 |
73492 |
8 |
-1523 |
12479 |
2319529 |
155725441 |
-19005517 |
12683 |
-204 |
41666 |
9 |
-1881 |
13099 |
3538161 |
171583801 |
-24639219 |
12938 |
161 |
25979 |
10 |
-1232 |
12629 |
1517824 |
159491641 |
-15558928 |
12476 |
153 |
23339 |
Итого |
-32405 |
139039 |
118333471 |
1942116603 |
-460024748 |
139037 |
2 |
2203522 |
Параметры и можно исчислить по формулам:
, (29)
. (30)
.
.
На основании уравнения регрессии построим график зависимости теоретических значений от факторного признака .
Рисунок 8 – График зависимости теоретических значений
Отклонения от средних по одной и другой переменным лежат в основе измерения корреляционной связи. Для того чтобы измерить тесноту корреляционной связи между факторным и результативным признаками воспользуемся линейным коэффициентом корреляции . Если знаки отклонений от средних совпадают, то связь прямая , если знаки отклонений не совпадают, то связь обратная . По абсолютной величине чем ближе значение к единице, тем теснее связь, чем ближе значение к нулю, тем слабее связь.
(31)
.
Полученное значение коэффициента корреляции показывает, что связь между естественной убылью населения и смертностью является обратной и весьма тесной.
Для расчета теоретического корреляционного отношения необходимо предварительно вычислить дисперсии по формулам 33 – 35.
Соотношение между факторной и общей дисперсиями характеризует меру тесноты связи между признаками и : . Показатель называется индексом детерминации. Он выражает долю факторной дисперсии в общей дисперсии, т.е. характеризует, какая часть общей вариации результативного признака объясняется изучаемым фактором . На основе формулы индекса детерминации определяется теоретическое корреляционное отношение :
(32)
.
Общая дисперсия отображает совокупное влияние всех факторов:
(33)
.
Остаточная дисперсия отображает вариацию результативного признака от всех прочих, кроме , факторов:
(34)
.
Факторная дисперсия отображает вариацию только от воздействия изучаемого фактора :
(35)
.
Индекс корреляционной связи вычисляется по формуле 36. Эта формула является основным алгоритмом для определения индекса корреляции с использованием машинной обработки анализируемых данных.
(36)
.
Частный коэффициент эластичности вычисляется по формуле:
(37)
где – параметр при признаке-факторе;
, – средние значения факторного и результативного признаков.
; ; .
.
Адекватность регрессионной модели при малой выборке можно оценить критерием Фишера:
, (38)
где – число параметров модели;
– число единиц наблюдения.
.
Эмпирическое значение критерия сравнивается с критическим или табличным значением с уровнем значимости 0,01 или 0,05 и числом степеней свободы , . Если эмпирическое значение критерия больше табличного значения, то уравнение регрессии признается значимым (адекватным).
При уровне значимости 0,01 и 0,05 и числом степеней свободы 1 и 8 табличное значение критерия Фишера равно 5981 и 238,9, а расчетное значение равно 24,4, т.к. в первом и во втором случаях расчетное значение меньше табличного, следовательно, уравнение регрессии признается не адекватным.
Значимость коэффициентов линейного уравнения регрессии оценивается с помощью критерия Стьюдента:
(39)
.
(40)
.
(41)
.
Эмпирическое значение t-критерия сравнивается с критическим или табличным значением t-распределения Стьюдента с уровнем значимости 0,01 или 0,05 и числом степеней свободы . Параметр признается значимым, если эмпирическое значение t больше табличного.
При уровне значимости 0,01 и числом степеней свободы 8 табличное значение t-распределения Стъюдента равно 3,3554, а расчетное значение – 69,90, т.к. расчетное значение больше табличного, следовательно, параметр признается значимым. При уровне значимости 0,05 и числом степеней свободы 8 табличное значение t-распределения Стъюдента равно 2,3060, а расчетное значение – 4,94, т.к. расчетное значение больше табличного, следовательно, параметр признается значимым.
Аналогично проводится оценка коэффициента корреляции с помощью t-критерия:
(42)
где – число степеней свободы.
.
Если эмпирическое значение t критерия оказывается больше табличного, то линейный коэффициент корреляции признается значимым.
Информация о работе Статистика естественного движения населения Амурской области