Анализ и прогнозирование динамики средней продолжительности жизни в 30 странах мира

Автор работы: Пользователь скрыл имя, 26 Июня 2014 в 06:10, курсовая работа

Описание работы

Целью данной курсовой работы является описание, моделирование и выявление тенденций временного ряда средней продолжительности жизни стран мира. Но главная задача данной работы – это построение наиболее точных прогнозов относительно средней продолжительности жизни.
Первая часть курсовой работы состоит из теоретических аспектов. Даётся полное описание временных рядов, методов моделирования, анализа и прогнозирования временных рядов.

Файлы: 1 файл

Курсовая работа по предмету Эконометрика.docx

— 599.51 Кб (Скачать файл)
  1. Полиномиальные
  2. Экспоненциальные
  3. S-образные

                   Полиномиальные кривые используются  для приближения и прогнозирования  временных рядов, в которых последующее  развитие не зависит от достигнутого  уровня.

=ao+a1*t – полином первой степени

=ao+a1*t+a2*t2 – полином второй степени

В отличие от полиномиальных кривых, использование экспоненциальных кривых предполагает, что дальнейшее развитие зависит от достигнутого уровня.

Используются две кривые: простая экспонента и модифицированная экспонента.

В экономике распространяются процессы, которые сначала растут медленно, затем ускоряются, а затем снова замедляют свой рост и т.д., например, спрос на товар. Для моделирования таких процессов используются S-образные кривые:

  1. Кривая Гомперца:

=k*, где

a, b – положительные параметры;

b<1;

K-асимптота.

  1. Логистическая кривая Перла-Рида:

, где

K-асимптота.

 

 

1.6 Проблема выбора вида кривой роста для конкретного временного ряда

Комплекс аналитических методов выравнивания временного ряда сводится к выбору конкретных кривых роста и определению их параметров. Плавную кривую (гладкую функцию), аппроксимирующую временной ряд, принято называть кривой роста.

Наиболее часто на практике используются кривые роста, которые позволяют описывать процессы трёх основных типов с монотонным характером развития без предела роста; пределом роста без точки перегиба, такие кривые называются кривыми с насыщением; пределом роста и с точкой перегиба, их называют S − образными кривыми.

Для описания процессов без предела роста служат функции-полиномы:

  • прямая yt = a0 + a1t ,
  • парабола yt = a0 + a1t + a2t2 ,
  • полином третьей степени yt = a0 + a1t + a2t + a3t3 ,
  • экспонента yt =ea0 + a1t,
  • гипербола yt = a0 + a1/t.

Процессы такого типа характерны, в основном, для абсолютных объёмных показателей.

Формирование набора моделей, одна из которых будет использована для получения прогноза, происходит на основе интуитивных приемов (таких, например, как анализ графика ряда динамики), формализованных статистических процедур (исследование приростов уровней), а также содержательного анализа процесса. Предпочтение, как правило, отдается простым моделям, допускающим содержательную интерпретацию. К числу наиболее простых относятся линейные модели роста:

где a0 и a1 параметры модели, а t = 1, 2, …, n.

Рассмотрим оценку параметров модели по методу, сводящемуся к поиску таких значений a0 и a1, при которых сумма квадратов отклонений эмпирических (опытных) данных от рассчитанных по модели является наименьшей – метод наименьших квадратов (МНК). Математически критерий такой оценки параметров записывается в виде:

Для нахождения минимума функции двух переменных следует взять частные производные по a0 и a1, а затем приравнять их к нулю.

        

В результате получаем систему нормальных уравнений:

Решая эту систему двух линейных уравнений с двумя неизвестными, получим:

                                                

Для выбора вида кривой часто используют последовательные разности. Вычисляют первые, вторые и высшие порядки разностей уровней временного ряда:

Вычисления осуществляют до тех пор, пока разности не будут почти одинаковыми. Если одинаковыми будут первые разности, то тренд описывается прямой; если приблизительно одинаковые значения имеют вторые разности, то за тренд берут параболу второго порядка и т.д.

 

1.7 Проверка адекватности моделей

Важным этапом прогнозирования социально-экономических процессов является проверка адекватности (соответствия) модели реальному явлению. Для ее осуществления исследуют ряд остатков , то есть отклонений расчетных значений от фактических. Если модель выбрана правильно, то для остатков характерны:

  1. случайный характер значений. Проверяется с помощью критерия поворотных точек;
  2. отсутствие автокорреляции (самозависимости). Остатки должны быть независимыми друг от друга. Проверяется с помощью критерия Дарбина – Уотсона;
  3. нормальный закон распределения. Проверяется с помощью R/S – критерия;
  4. математическое ожидание остатков должно быть равно нулю и дисперсия остатков должна быть неизменна во времени. Проверяется с помощью t– критерия Стьюдента.

Для проверки условия случайности возникновения отдельных отклонений от модели часто используется критерий, основанный на поворотных точках. Уровень последовательности Ei считается максимумом, если он больше двух рядом стоящих уровней, т.е. Ei -1 < Ei > Ei +1 и минимумом, если он меньше обоих соседних уровней, т.е. Ei -1 > Ei < Ei +1. В обоих случаях Ei считается поворотной точкой; общее число поворотных точек для остаточной последовательности Ei обозначим через p.

В случайной выборке математическое ожидание числа точек поворота p и дисперсия s2p выражаются формулами:

Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства , где квадратные скобки означают целую часть числа. Если неравенство выполняется, то с вероятностью 95% делаем вывод о случайном характере ряда остатков. Если это неравенство не выполняется, модель считается неадекватной.

Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина—Уотсона. Необходимо вычислить расчетное значение , где Еi – i- тый уровень остаточной последовательности (i=1..9). Теоретическое обоснование применения этого критерия обусловлено тем, что в динамических рядах как сами наблюдения, так и отклонения от них расположены в хронологическом порядке.

Значение d может располагаться в пределах от 0 до 4. При отсутствии автокорреляции значение d примерно равно 2. При полной автокорреляции – 0 или 4. Следовательно, оценки, получаемые по этому критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или опровергнуть гипотезу об отсутствия автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения для этих границ при 5% уровне значимости приведены в Приложении 2. При сравнении расчетного значения d  с табличным могут возникнуть следующие ситуации:

  • d2<d<2 – ряд остатков не коррелирован;
  • d<d1 – остатки содержат автокорреляцию;
  • d1<d<d2 – область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Необходимо применять другой критерий;
  • d>2, то это свидетельствует об отрицательной связи, и его надо преобразовать по формуле d' = 4-d и посмотреть, в какой из трех первых интервалов попадает значение d'.

Установив наличие автокорреляции остатков, надо улучшать модель.

Если же ситуация оказалась неопределенной (d1<d<d2), применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции: . Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду расчетное значение коэффициента r1  сравнивают с критическим для 5%-го уровня значимости (в нашем случае можно взять в качестве rкрит = 0,36). Если │r1│ меньше критического значения, то делается вывод об отсутствии автокорреляции в ряду остатков. Если │r1│ больше

Проверка гипотезы о нормальном распределении остаточной последовательности по R/SE – критерию. В нашем случае R = Emax - Emin, где Emax и Emin соответственно максимальный и минимальный уровни ряда остатков; . Вычисленное значение R/SE-критерия сравнивается с критическими нижней и верхней границами данного отношения. Критические границы приведены в Приложении 3. Если значение R/SE попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о том, что остаточная последовательность распределена по нормальному закону, принимается; в противном случае эта гипотеза отвергается.

Проверка гипотезы о равенстве математического ожидания случайной компоненты нулю на основе t - критерия Стьюдента. Расчетное значение этого критерия задается формулой где — среднее арифметическое значение уровней остаточной последовательности Et; SE — стандартное (среднеквадратическое) отклонение для этой последовательности. Если расчетное значение t меньше критического значения ta,v статистики Стьюдента с заданным уровнем значимости a и числом степеней свободы v=n-1, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается; в противном случае эта гипотеза отвергается и модель считается неадекватной.

Если все четыре вышеперечисленные критерии дают положительный ответ, делается вывод о том, что выбранная модель является адекватной реальному ряду экономической динамики. Только в этом случае ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.

1.8 Оценка качества, значимости и точности модели

Если модель оказалась статистически адекватной эмпирическим данным, то предстоит оценить ее качество, значимость и точность.

Проверка качества модели проводится с помощью коэффициента детерминации . Он показывает, какую долю вариации исследуемого признака Y описывает наша модель под воздействием изучаемого фактора. Чем ближе к единице R2, тем лучше качество модели.

Проверка значимости модели проводится с помощью F – теста. Если расчетное значение Fрасч больше критического Fa,n1,n2 при заданном уровне значимости a и со степенями свободы v1=m и v2=n-m (где m – число факторов, включенных в модель), то модель считается значимой.

Для оценки точности модели используйте стандартную ошибку оценки прогнозируемого показателя (или среднеквадратическое отклонение от линии тренда)

,

где n- число опытов, m - число факторов, включенных в модель, и среднюю относительную ошибку аппроксимации . Если ошибка Еотн не превышает 15%, то точность модели считается приемлемой. В общем случае допустимый уровень точности, а, значит, и надежности прогноза, устанавливает пользователь модели, который в результате содержательного анализа проблемы выясняет, насколько она чувствительна к точности решения и насколько велики потери из-за неточного решения.

1.9 Построение прогнозов

Если в ходе проверки разрабатываемая модель признана значимой, достаточно точной, и ее качество нас устраивает, то на ее основе разрабатывается точечный прогноз. Он получается путем подстановки в модель значений времени t, соответствующих периоду упреждения k (количество шагов прогноза): t=n+k. Так в случае трендовой модели в виде полинома первой степени – линейной модели роста – экстраполяция на k шагов вперед имеет вид:

Для учета случайных колебаний при прогнозировании рассчитываются доверительные интервалы, зависящие от стандартной ошибки, периода упреждения k, длины временного интервала n и уровня значимости прогноза α. В частности, для прогноза будущие значения с вероятностью (1–α) попадут в интервал:

 где 
.

 

 

2 Практическая часть

Для практической части я использовал данные о смертности от болезней в г. Бердске с июля 2010, по февраль 2012.

Исходные данные:

t

Yt,

1

96

2

90

3

85

4

84

5

86

6

93

7

74

8

83

9

86

10

75

11

73

12

92

13

105

14

61

15

90

16

74

17

82

18

66

19

76

20

69

21

91

22

88

23

86

24

62

25

82

26

95

27

84

28

103

29

99

30

101

31

83

32

77

Информация о работе Анализ и прогнозирование динамики средней продолжительности жизни в 30 странах мира