Автор работы: Пользователь скрыл имя, 26 Июня 2014 в 06:10, курсовая работа
Целью данной курсовой работы является описание, моделирование и выявление тенденций временного ряда средней продолжительности жизни стран мира. Но главная задача данной работы – это построение наиболее точных прогнозов относительно средней продолжительности жизни.
Первая часть курсовой работы состоит из теоретических аспектов. Даётся полное описание временных рядов, методов моделирования, анализа и прогнозирования временных рядов.
Предварительный анализ – это выявление и устранение аномальных значений уровней временного ряда, а так же определение наличия тренда.
Определение аномальных уровней.
Найдём средний показатель смертности;
Yt =84, 09
Для выявления аномальных уровней используют методы математической статистики, например метод Ирвина. Используя данный метод, рассчитаем среднеквадратическое отклонение:
t=2, 3…n
σy= 11,30
t |
yt |
yt -ˉyср |
(yt -ˉyср)2 |
λ |
1 |
96 |
11,91 |
141,84 |
|
2 |
90 |
5,91 |
34,92 |
0,530 |
3 |
85 |
0,91 |
0,82 |
0,442 |
4 |
84 |
0,09 |
0,01 |
0,088 |
5 |
86 |
1,91 |
3,64 |
0,176 |
6 |
93 |
8,91 |
79,38 |
0,619 |
7 |
74 |
-10,09 |
101,80 |
1,681 |
8 |
83 |
-1,09 |
1,18 |
0,796 |
9 |
86 |
1,91 |
3,64 |
0,265 |
10 |
75 |
-9,09 |
82,62 |
0,973 |
11 |
73 |
-11,09 |
122,98 |
0,176 |
12 |
92 |
7,91 |
62,56 |
1,681 |
13 |
105 |
20,91 |
437,22 |
1,150 |
14 |
61 |
-23,09 |
533,14 |
3,893 |
15 |
90 |
5,91 |
34,92 |
2,566 |
16 |
74 |
-10,09 |
101,80 |
1,415 |
17 |
82 |
-2,09 |
4,36 |
0,707 |
18 |
66 |
-18,09 |
327,24 |
1,415 |
19 |
76 |
-8,09 |
65,44 |
0,884 |
20 |
69 |
-15,09 |
227,70 |
0,619 |
21 |
91 |
6,91 |
47,74 |
1,946 |
22 |
88 |
3,91 |
15,28 |
0,265 |
23 |
86 |
1,91 |
3,64 |
0,176 |
24 |
62 |
-22,09 |
487,96 |
2,123 |
25 |
82 |
-2,09 |
4,36 |
1,769 |
26 |
95 |
10,91 |
119,02 |
1,150 |
27 |
84 |
-0,09 |
0,01 |
0,973 |
28 |
103 |
18,91 |
357,58 |
1,681 |
29 |
99 |
14,91 |
222,30 |
0,353 |
30 |
101 |
16,91 |
285,94 |
0,176 |
31 |
83 |
-1,09 |
1,18 |
1,592 |
32 |
77 |
-7,09 |
50,26 |
0,530 |
Если λtрасч > λtтабл то соответствующие значение уровня является аномальным. Для n=30, λtтабл=1,2, a=0.05.
Сравнив полученные значения, мною было выявлено 11 аномальных значений уровня.
Следующим этапом мы определяем наличие тренда.
Наличие тренда проверяем с помощью метода проверки разностей средних уровней. Для этого разбиваем наш исходный временной ряд на две примерно равные по числу уровней части, в данном случае каждая часть будет состоять из 15 значений. Затем для каждой из этих частей находим средние величины и дисперсии.
и
Проверяем гипотезу о равенстве дисперсии обеих частей с помощью критерия Фишера. Далее при делении большего значения на меньшее мы находим расчетное значение по Фишеру.
Fрасч=162,12/117,55=1,379
Fтабл=2,50
Fрасч < Fтабл
Так как, Fрасч < Fтабл переходим в 4-му этапу. Проверяем гипотезу об отсутствии тренда с помощью критерия Стьюдента.
, где
Если tрасч меньше табличного значения tтабл, то гипотеза принимается, т.е. тренда нет, в противном случае тренд есть. При заданном а=0,05 и к=n1+n2-2, tтабл =2,05
σ=0,31
tрасч =3,06
tрасч > tтабл, значит гипотеза не принимается, т.е .тренд есть.
Сглаживание (выравнивание) временного ряда:
С целью более четкого выявления тенденции развития, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание временных рядов. Существует 2 метода сглаживания: аналитическое сглаживание и механическое. Мы будем использовать механический метод. Определяем интервал сглаживания при m=3 и вычисляем среднее арифметическое.
Например:
Для первого и последнего значения рекомендуется использовать следующие функции:
yt |
|
75,8 |
75,82 |
75,95 |
75,92 |
76 |
76,17 |
76,55 |
76,40 |
76,65 |
76,70 |
76,9 |
76,87 |
77,05 |
77,12 |
77,4 |
77,40 |
77,75 |
77,72 |
78 |
77,93 |
78,05 |
78,05 |
78,1 |
78,15 |
78,3 |
78,33 |
78,6 |
78,55 |
78,75 |
78,78 |
79 |
78,93 |
79,05 |
79,05 |
79,1 |
79,10 |
79,15 |
79,17 |
79,25 |
79,23 |
79,3 |
79,35 |
79,5 |
79,53 |
79,8 |
79,73 |
79,9 |
79,88 |
79,95 |
79,97 |
80,05 |
80,15 |
80,45 |
80,40 |
80,7 |
80,72 |
81 |
81,23 |
82 |
81,88 |
Далее выбираем трендовую модель с помощью метода конкретных разностей.
Представим расчёты в виде таблицы
yt |
|
logut |
logut/yt |
logut/yt2 | |||
75,8 |
75,82 |
||||||
75,95 |
75,92 |
0,175 |
0,002305 |
-1,743 |
-6,07261 |
-10,402242 | |
76 |
76,17 |
0,241667 |
0,0458 |
0,003173 |
-1,420 |
-5,75312 |
-10,086044 |
76,55 |
76,40 |
0,266667 |
-0,0042 |
0,00349 |
-1,322 |
-5,65774 |
-9,9937212 |
76,65 |
76,70 |
0,233333 |
-0,0292 |
0,003042 |
-1,455 |
-5,79519 |
-10,135091 |
76,9 |
76,87 |
0,208333 |
0,0167 |
0,00271 |
-1,569 |
-5,91069 |
-10,252761 |
77,05 |
77,12 |
0,266667 |
0,0458 |
0,003458 |
-1,322 |
-5,66708 |
-10,012395 |
77,4 |
77,40 |
0,3 |
0,0000 |
0,003876 |
-1,204 |
-5,55296 |
-9,9019464 |
77,75 |
77,72 |
0,266667 |
-0,0667 |
0,003431 |
-1,322 |
-5,67483 |
-10,027895 |
78 |
77,93 |
0,166667 |
-0,0792 |
0,002139 |
-1,792 |
-6,14761 |
-10,503467 |
78,05 |
78,05 |
0,108333 |
-0,0125 |
0,001388 |
-2,223 |
-6,57989 |
-10,937242 |
78,1 |
78,15 |
0,141667 |
0,0458 |
0,001813 |
-1,954 |
-6,31291 |
-10,671539 |
78,3 |
78,33 |
0,2 |
0,0417 |
0,002553 |
-1,609 |
-5,97041 |
-10,331384 |
78,6 |
78,55 |
0,225 |
-0,0042 |
0,002864 |
-1,492 |
-5,85539 |
-10,219126 |
78,75 |
78,78 |
0,191667 |
-0,0458 |
0,002433 |
-1,652 |
-6,0187 |
-10,3854 |
79 |
78,93 |
0,133333 |
-0,0542 |
0,001689 |
-2,015 |
-6,38351 |
-10,75211 |
79,05 |
79,05 |
0,083333 |
-0,0375 |
0,001054 |
-2,485 |
-6,85499 |
-11,225068 |
79,1 |
79,10 |
0,058333 |
-0,0083 |
0,000737 |
-2,842 |
-7,21229 |
-11,583007 |
79,15 |
79,17 |
0,066667 |
0,0167 |
0,000842 |
-2,708 |
-7,07961 |
-11,451161 |
79,25 |
79,23 |
0,091667 |
0,0417 |
0,001157 |
-2,390 |
-6,76199 |
-11,134391 |
79,3 |
79,35 |
0,15 |
0,0500 |
0,00189 |
-1,897 |
-6,27099 |
-10,644857 |
79,5 |
79,53 |
0,191667 |
0,0125 |
0,00241 |
-1,652 |
-6,02817 |
-10,40435 |
79,8 |
79,73 |
0,175 |
-0,0375 |
0,002195 |
-1,743 |
-6,12166 |
-10,500345 |
79,9 |
79,88 |
0,116667 |
-0,0208 |
0,00146 |
-2,148 |
-6,529 |
-10,909569 |
79,95 |
79,97 |
0,133333 |
0,0500 |
0,001667 |
-2,015 |
-6,39651 |
-10,778123 |
80,05 |
80,15 |
0,216667 |
0,0750 |
0,002703 |
-1,529 |
-5,9133 |
-10,297195 |
80,45 |
80,40 |
0,283333 |
0,1000 |
0,003524 |
-1,261 |
-5,64815 |
-10,03516 |
80,7 |
80,72 |
0,416667 |
0,1500 |
0,005162 |
-0,875 |
-5,26641 |
-9,6573589 |
81 |
81,23 |
0,583333 |
0,007181 |
-0,539 |
-4,93632 |
-9,3336478 | |
82 |
81,88 |
На основе полученных данных выбираем вид трендовой модели, в нашем случае он линейный. Если в качестве Yt использовать полином вида Yt=a+b*t, то для определения параметров a и b получим систему линейных уравнений:
Подставляем наши данные в уравнение и находим a и b.
a=75,85
b=0,18
После того как мы выявили модель проверяем ее на адекватность. Трендовая модель считается адекватной, если правильно отражает систематические компоненты временного ряда. Это требование эквивалентно следующему требованию: остаточная компонента (Et) должна удовлетворять следующим 4 свойствам:
Проверка 1 свойства означает проверку гипотезы о правильности выбора вида модели, тренда:
1.Критерий серий.
Kmax – серия максимальной длины, а v – общее число серий. Если Еt>Еm, то ставим «+», если наоборот то ставим «-».
Критерий серий | |
V - число серий |
K max |
6 |
13 |
10,22 |
14,52 |
1 условие не выполняется |
Так как гипотеза по критерию серий не верна, я рассмотрела адекватность модели с помощью критерия поворотных точек (пиков).
Et-1<Et>Et+1 – то будет считаться мах;
Et-1>Et<Et+1 – то min.
И в том и в другом случае, точка будет называться поворотной точкой.
Р – количество поворотных точек. Математическое ожидание поворотных точек (Р) определяется по формуле:
= 2/3*(n-2)
Дисперсия определяется:
=
При а=0,05, проверяем выполнение следующего условия:
если Р> [], то 1свойство выполняется.
Критерий поворотных точек | ||
Р=13 |
||
= |
18,66667 |
|
= |
5,011111 |
|
P> |
2,847093 |
|
13> |
2,847093 |
|
1 условие выполняется |
Проверка 2 свойства:
Проверяем с помощью показателей ассиметрии и экцесса.
A - коэффициент ассиметрии
Э – коэффициент экцесса
A = -1,14
-3
Э = -2,36
Одновременно должно выполняться два условия:
Так как , значит, свойство не выполняется. И мы будем проверяем модель на адекватность с помощью критерия согласия .
Для этого разобьем данные на группы.
k |
6 |
R |
1,23 |
h |
0,205 |
k – количество групп (6 групп),
R – размах вариации,
h – длина интервала.
∆1=[min Et; min Et + h)
∆2=[ min Et + h; min Et + 2h) и т.д. получает шесть интервалов.
Полученные интервалы
№ интервала |
Нижняя граница |
Верхняя граница |
Кол-во попавших значений в интервал |
∆1 |
-0,48 |
-0,275 |
5 |
∆2 |
-0,275 |
-0,070 |
10 |
∆3 |
-0,070 |
0,135 |
7 |
∆4 |
0,135 |
0,340 |
6 |
∆5 |
0,340 |
0,545 |
1 |
∆6 |
0,545 |
0,750 |
1 |
Далее вычисляем Pi=F(b)-F(a) – вероятность попадания в тот или иной интервал.
Вероятность попадания в тот или иной интервал
№ п/п |
Pi |
n*Pi |
Pi` |
Число значений, попавших в интервал |
Р1 |
0,139834289 |
4,195029 |
8,211323 |
7 |
Р2 |
0,261764668 |
7,85294 |
7,85294 |
10 |
Р3 |
0,284664451 |
8,539934 |
8,539934 |
7 |
Р4 |
0,179860126 |
5,395804 |
5,395804 |
6 |
Р5 |
0,0659815 |
1,979445 |
||
Р6 |
0,067894965 |
2,036849 |