Автор работы: Пользователь скрыл имя, 26 Июня 2014 в 06:10, курсовая работа
Целью данной курсовой работы является описание, моделирование и выявление тенденций временного ряда средней продолжительности жизни стран мира. Но главная задача данной работы – это построение наиболее точных прогнозов относительно средней продолжительности жизни.
Первая часть курсовой работы состоит из теоретических аспектов. Даётся полное описание временных рядов, методов моделирования, анализа и прогнозирования временных рядов.
Полиномиальные кривые
=ao+a1*t – полином первой степени
=ao+a1*t+a2*t2 – полином второй степени
В отличие от полиномиальных кривых, использование экспоненциальных кривых предполагает, что дальнейшее развитие зависит от достигнутого уровня.
Используются две кривые: простая экспонента и модифицированная экспонента.
В экономике распространяются процессы, которые сначала растут медленно, затем ускоряются, а затем снова замедляют свой рост и т.д., например, спрос на товар. Для моделирования таких процессов используются S-образные кривые:
=k*, где
a, b – положительные параметры;
b<1;
K-асимптота.
, где
K-асимптота.
Комплекс аналитических методов выравнивания временного ряда сводится к выбору конкретных кривых роста и определению их параметров. Плавную кривую (гладкую функцию), аппроксимирующую временной ряд, принято называть кривой роста.
Наиболее часто на практике используются кривые роста, которые позволяют описывать процессы трёх основных типов с монотонным характером развития без предела роста; пределом роста без точки перегиба, такие кривые называются кривыми с насыщением; пределом роста и с точкой перегиба, их называют S − образными кривыми.
Для описания процессов без предела роста служат функции-полиномы:
Процессы такого типа характерны, в основном, для абсолютных объёмных показателей.
Формирование набора моделей, одна из которых будет использована для получения прогноза, происходит на основе интуитивных приемов (таких, например, как анализ графика ряда динамики), формализованных статистических процедур (исследование приростов уровней), а также содержательного анализа процесса. Предпочтение, как правило, отдается простым моделям, допускающим содержательную интерпретацию. К числу наиболее простых относятся линейные модели роста:
где a0 и a1 параметры модели, а t = 1, 2, …, n.
Рассмотрим оценку параметров модели по методу, сводящемуся к поиску таких значений a0 и a1, при которых сумма квадратов отклонений эмпирических (опытных) данных от рассчитанных по модели является наименьшей – метод наименьших квадратов (МНК). Математически критерий такой оценки параметров записывается в виде:
Для нахождения минимума функции двух переменных следует взять частные производные по a0 и a1, а затем приравнять их к нулю.
В результате получаем систему нормальных уравнений:
Решая эту систему двух линейных уравнений с двумя неизвестными, получим:
Для выбора вида кривой часто используют последовательные разности. Вычисляют первые, вторые и высшие порядки разностей уровней временного ряда:
Вычисления осуществляют до тех пор, пока разности не будут почти одинаковыми. Если одинаковыми будут первые разности, то тренд описывается прямой; если приблизительно одинаковые значения имеют вторые разности, то за тренд берут параболу второго порядка и т.д.
Важным этапом прогнозирования социально-экономических процессов является проверка адекватности (соответствия) модели реальному явлению. Для ее осуществления исследуют ряд остатков , то есть отклонений расчетных значений от фактических. Если модель выбрана правильно, то для остатков характерны:
Для проверки условия случайности возникновения отдельных отклонений от модели часто используется критерий, основанный на поворотных точках. Уровень последовательности Ei считается максимумом, если он больше двух рядом стоящих уровней, т.е. Ei -1 < Ei > Ei +1 и минимумом, если он меньше обоих соседних уровней, т.е. Ei -1 > Ei < Ei +1. В обоих случаях Ei считается поворотной точкой; общее число поворотных точек для остаточной последовательности Ei обозначим через p.
В случайной выборке математическое ожидание числа точек поворота p и дисперсия s2p выражаются формулами:
Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства , где квадратные скобки означают целую часть числа. Если неравенство выполняется, то с вероятностью 95% делаем вывод о случайном характере ряда остатков. Если это неравенство не выполняется, модель считается неадекватной.
Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина—Уотсона. Необходимо вычислить расчетное значение , где Еi – i- тый уровень остаточной последовательности (i=1..9). Теоретическое обоснование применения этого критерия обусловлено тем, что в динамических рядах как сами наблюдения, так и отклонения от них расположены в хронологическом порядке.
Значение d может располагаться в пределах от 0 до 4. При отсутствии автокорреляции значение d примерно равно 2. При полной автокорреляции – 0 или 4. Следовательно, оценки, получаемые по этому критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или опровергнуть гипотезу об отсутствия автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения для этих границ при 5% уровне значимости приведены в Приложении 2. При сравнении расчетного значения d с табличным могут возникнуть следующие ситуации:
Установив наличие автокорреляции остатков, надо улучшать модель.
Если же ситуация оказалась неопределенной (d1<d<d2), применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции: . Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду расчетное значение коэффициента r1 сравнивают с критическим для 5%-го уровня значимости (в нашем случае можно взять в качестве rкрит = 0,36). Если │r1│ меньше критического значения, то делается вывод об отсутствии автокорреляции в ряду остатков. Если │r1│ больше
Проверка гипотезы о нормальном распределении остаточной последовательности по R/SE – критерию. В нашем случае R = Emax - Emin, где Emax и Emin соответственно максимальный и минимальный уровни ряда остатков; . Вычисленное значение R/SE-критерия сравнивается с критическими нижней и верхней границами данного отношения. Критические границы приведены в Приложении 3. Если значение R/SE попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о том, что остаточная последовательность распределена по нормальному закону, принимается; в противном случае эта гипотеза отвергается.
Проверка гипотезы о равенстве математического ожидания случайной компоненты нулю на основе t - критерия Стьюдента. Расчетное значение этого критерия задается формулой где — среднее арифметическое значение уровней остаточной последовательности Et; SE — стандартное (среднеквадратическое) отклонение для этой последовательности. Если расчетное значение t меньше критического значения ta,v статистики Стьюдента с заданным уровнем значимости a и числом степеней свободы v=n-1, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается; в противном случае эта гипотеза отвергается и модель считается неадекватной.
Если все четыре вышеперечисленные критерии дают положительный ответ, делается вывод о том, что выбранная модель является адекватной реальному ряду экономической динамики. Только в этом случае ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.
Если модель оказалась статистически адекватной эмпирическим данным, то предстоит оценить ее качество, значимость и точность.
Проверка качества модели проводится с помощью коэффициента детерминации . Он показывает, какую долю вариации исследуемого признака Y описывает наша модель под воздействием изучаемого фактора. Чем ближе к единице R2, тем лучше качество модели.
Проверка значимости модели проводится с помощью F – теста. Если расчетное значение Fрасч больше критического Fa,n1,n2 при заданном уровне значимости a и со степенями свободы v1=m и v2=n-m (где m – число факторов, включенных в модель), то модель считается значимой.
Для оценки точности модели используйте стандартную ошибку оценки прогнозируемого показателя (или среднеквадратическое отклонение от линии тренда)
где n- число опытов, m - число факторов, включенных в модель, и среднюю относительную ошибку аппроксимации . Если ошибка Еотн не превышает 15%, то точность модели считается приемлемой. В общем случае допустимый уровень точности, а, значит, и надежности прогноза, устанавливает пользователь модели, который в результате содержательного анализа проблемы выясняет, насколько она чувствительна к точности решения и насколько велики потери из-за неточного решения.
Если в ходе проверки разрабатываемая модель признана значимой, достаточно точной, и ее качество нас устраивает, то на ее основе разрабатывается точечный прогноз. Он получается путем подстановки в модель значений времени t, соответствующих периоду упреждения k (количество шагов прогноза): t=n+k. Так в случае трендовой модели в виде полинома первой степени – линейной модели роста – экстраполяция на k шагов вперед имеет вид:
Для учета случайных колебаний при прогнозировании рассчитываются доверительные интервалы, зависящие от стандартной ошибки, периода упреждения k, длины временного интервала n и уровня значимости прогноза α. В частности, для прогноза будущие значения с вероятностью (1–α) попадут в интервал:
Для практической части я использовал данные о смертности от болезней в г. Бердске с июля 2010, по февраль 2012.
Исходные данные:
t |
Yt, |
1 |
96 |
2 |
90 |
3 |
85 |
4 |
84 |
5 |
86 |
6 |
93 |
7 |
74 |
8 |
83 |
9 |
86 |
10 |
75 |
11 |
73 |
12 |
92 |
13 |
105 |
14 |
61 |
15 |
90 |
16 |
74 |
17 |
82 |
18 |
66 |
19 |
76 |
20 |
69 |
21 |
91 |
22 |
88 |
23 |
86 |
24 |
62 |
25 |
82 |
26 |
95 |
27 |
84 |
28 |
103 |
29 |
99 |
30 |
101 |
31 |
83 |
32 |
77 |