Автор работы: Пользователь скрыл имя, 20 Июня 2013 в 15:21, курсовая работа
Целью данной работы является построение адекватной модели прогноза ряда.
Исходным рядом служит частота встречаемости названий закрытых административно-территориальных преобразований в еженедельных выпусках газеты г. Сарова «Городской курьер» с 3 июня 1997 года по 11 мая 2005 года. Таким образом, ряд содержит 414 точек. Каждое значение ряда представляет собой сумму частоты встречаемости следующих ЗАТО Минатома: Трехгорного, Снежинска, Лесного, Заречного, Зеленогорска, Озерска, Новоуральска, Железногорска, Северска во всех статьях данного выпуска
Цель и задачи работы 3
Выбор методов прогнозирования 3
Анализ сезонности ряда с помощью Спектрального (Фурье) анализа 4
Прогнозирование ряда методом АРИМА с интервенцией 5
Разложение ряда на компоненты методом Сезонной корректировки X-11 (метод Census II) 11
Прогнозирование ряда без шумовой компоненты методом Экспоненциального сглаживания 15
Окончательная оценка прогнозов: сравнение прогнозных значений с истинными 17
График 7. Тренд-циклическая компонента ряда частоты упоминаний названий ЗАТО в газете
График 8. Сезонная компонента ряда частоты упоминаний названий ЗАТО в газете
График 9. Шумовая компонента ряда частоты упоминаний названий ЗАТО в газете
Точные значения тренд-циклической и сезонной компонент представлены в таблицах 5, 6. Из суммы этих значений получаем новый ряд без шумовой компоненты.
Таблица 5. Значения тренд-циклической компоненты ряда частоты упоминаний названий ЗАТО в газете
Таблица 6. Значения сезонной компоненты ряда частоты упоминаний названий ЗАТО в газете
Получившийся ряд представлен на графике 10. В целом он напоминает исходный ряд с уменьшенной дисперсией.
График 10. Ряд частоты упоминаний названий ЗАТО в газете без шумовой компоненты
Для построения прогноза ряда частоты упоминаний названий ЗАТО без влияния внешних воздействий был выбран метод Экспоненциального сглаживания. Такой выбор был сделан по следующей причине – после удаления шумовой компоненты ряд стал более простым, следовательно, к нему можно применить метод экспоненциального сглаживания.
Для построения модели прогноза необходимо определить наилучшие параметры сглаживания Alpha и Delta. Это делается в диалоговом окне Экспоненциального сглаживания на закладке Grid Search. Наиболее подходящими значениями параметров сглаживания являются Alpha=0,9 и Delta=0,1. Именно при таких параметрах модели абсолютная ошибка минимальна.
Таблица 7. Выбор параметров сглаживания ряда без шумовой компоненты
В диалоговом окне Экспоненциального сглаживания задаем параметры модели: аддитивная сезонность, Alpha=0,9 и Delta=0,1. Значения сезонных факторов берем из ряда, выделенного с помощью Сезонной корректировки Х-11. Вследствие того, что сезонный лаг при выделении сезонной компоненты составлял 12 точек, выставляем именно это значение.
Рисунок 7. Диалоговое окно метода Экспоненциального сглаживания
Результаты построения прогноза методом Экспоненциального сглаживания представлены на графике 11 и в таблице 8. Прогноз свидетельствует о том, что в каждом из последующих 25 выпусков газеты названия закрытых городов Минатома будут упоминаться не более 1 раза. Если сравнить значения этого прогноза с прогнозом методом АРИМА прерванная, то видно, что прогноз исходного ряда методом АРИМА прерванная дает более высокие значения частоты упоминаний ЗАТО (в среднем от 1 до 2-ух упоминаний). Это можно объяснить большей дисперсией исходного ряда, которая после удаления шумовой компоненты была уменьшена.
График 11. Прогноз ряда без шумовой компоненты методом Экспоненциального сглаживания
Таблица 8. Прогноз ряда без шумовой компоненты методом Экспоненциального сглаживания
Case |
Smoothed Series |
Case |
Smoothed Series | |
361 |
0,636121 |
374 |
0,873598 | |
362 |
0,873598 |
375 |
0,977321 | |
363 |
0,977321 |
376 |
0,987118 | |
364 |
0,987118 |
377 |
1,180708 | |
365 |
1,180708 |
378 |
1,075610 | |
366 |
1,075610 |
379 |
0,646008 | |
367 |
0,646008 |
380 |
0,459315 | |
368 |
0,459315 |
381 |
0,414849 | |
369 |
0,414849 |
382 |
0,306892 | |
370 |
0,306892 |
383 |
0,426400 | |
371 |
0,426400 |
384 |
0,610936 | |
372 |
0,610936 |
385 |
0,636121 | |
373 |
0,636121 |
Распределение остатков близко к нормальному, следовательно, модель прогноза можно считать адекватной.
Гистограмма 5. Распределение остатков ряда без шумовой компоненты
График 12. Распределение остатков ряда без шумовой компоненты
Окончательное оценивание любого прогноза происходит со временем, когда прогноз сбывается либо нет. В данной работе прогноз был построен двумя способами: методом АРИМА прерванная, модель включала 2 параметра авторегрессии, сезонный лаг равный 3-ем и разность 5; методом Экспоненциального сглаживания с предварительным вычитанием шумовой компоненты (модель включала параметры сглаживания Alpha=0,9 и Delta=0,1, сезонные факторы, выделенные методом Сезонной корректировки Х-11 с лагом 12). Прогнозы незначительно отличаются друг от друга (в среднем примерно на 1 значение).
Сравнение прогнозируемой частоты упоминаний названий ЗАТО в газете «Городской курьер» представлено в таблице 9 и на графике 13.
Таблица 9. Сравнение прогнозируемых значений с истинными
Дата выпуска газеты |
Прогноз исходного ряда методом АРИМА с интервенцией |
Прогноз ряда без шумовой компоненты методом Экспоненциального сглаживания |
Истинные значения ряда |
Разность прогноза методом АРИМА с интервенцией и истинными значениями (по модулю) |
Разность прогноза методом Экспоненциального сглаживания и истинными значениями ряда (по модулю) |
18 мая 2005 |
1,885509 |
0,636121 |
4 |
2,114491 |
3,363879 |
25 мая 2005 |
2,091222 |
0,873598 |
0 |
2,091222 |
0,873598 |
1 июня 2005 |
1,012622 |
0,977321 |
3 |
1,987378 |
2,022679 |
8 июня 2005 |
0,991724 |
0,987118 |
14 |
13,008276 |
13,012882 |
15 июня 2005 |
-0,001354 |
1,180708 |
1 |
1,001354 |
0,180708 |
22 июня 2005 |
1,886256 |
1,07561 |
0 |
1,886256 |
1,07561 |
29 июня 2005 |
2,091365 |
0,646008 |
2 |
0,091365 |
1,353992 |
6 июля 2005 |
1,012555 |
0,459315 |
0 |
1,012555 |
0,459315 |
13 июля 2005 |
0,991709 |
0,414849 |
0 |
0,991709 |
0,414849 |
20 июля 2005 |
-0,001348 |
0,306892 |
0 |
0,001348 |
0,306892 |
27 июля 2005 |
1,886257 |
0,4264 |
0 |
1,886257 |
0,4264 |
3 августа 2005 |
2,091364 |
0,610936 |
0 |
2,091364 |
0,610936 |
10 августа 2005 |
1,012555 |
0,636121 |
9 |
7,987445 |
8,363879 |
17 августа 2005 |
0,991709 |
0,873598 |
|||
24 августа 2005 |
-0,00135 |
0,977321 |
|||
31 августа 2005 |
1,886257 |
0,987118 |
|||
7 сентября 2005 |
2,091364 |
1,180708 |
|||
14 сентября 2005 |
1,012555 |
1,07561 |
0 |
1,012555 |
1,07561 |
21 сентября 2005 |
0,991709 |
0,646008 |
0 |
0,991709 |
0,646008 |
28 сентября 2005 |
-0,00135 |
0,459315 |
0 |
0,00135 |
0,459315 |
5 октября 2005 |
1,886257 |
0,414849 |
3 |
1,113743 |
2,585151 |
12 октября 2005 |
2,091364 |
0,306892 |
0 |
2,091364 |
0,306892 |
19 октября 2005 |
1,012555 |
0,4264 |
6 |
4,987445 |
5,5736 |
26 октября 2005 |
0,991709 |
0,610936 |
17 |
16,008291 |
16,389064 |
2 ноября 2005 |
-0,00135 |
0,636121 |
|||
62,357477 |
59,501259 |
График 13. Сравнение прогнозируемых значений с истинными
Частота упоминаний ЗАТО в газете известна не по всем 25 выпускам газеты, но сравнение провести все равно можно. Разница прогнозируемых значений с истинными велика, из чего можно заключить, что прогнозы не сбылись. Разница между истинными значениями ряда и прогнозом методом Экспоненциального сглаживания чуть меньше разницы истинных значений с прогнозируемыми методом АРИМА с интервенцией. Но говорить о более адекватном прогнозе нельзя.
Внешние воздействия на частоту упоминаний ЗАТО в газете оказались непредсказуемыми. В эти 25 недель произошли следующие события:
Неспособность дать адекватный прогноз не является недостатком предложенных моделей прогноза, просто логика ряда слишком подвержена событиям извне, поэтому, чтобы построить адекватный прогноз, необходимо учитывать ряд других факторов, как например, план поездок чиновников закрытых городов в другие ЗАТО или график совещаний Минатома и других структур по проблемам ЗАТО. Предположительно, частота упоминаний ЗАТО будет коррелировать с частотой упоминаний ЗАТО в графике совещаний Минатома и др. с запаздыванием не более 7 дней (т.е. событие будет описано в ближайшем выпуске газеты).
1 Интервенцию на 407 шаге невозможно учитывать в данной модели, т. к. необходимо минимум 10 точек после интервенции, а ряд составляют только 414 точек.
Периоды 82,8 и 16,5686 точек, выделенные с помощью Спектрального анализа, не учитываются в данной модели, т. к. первый из них слишком велик (при округлении до 83 точек в ряд не укладываются необходимые для анализа 5 циклов), а второй слишком грубо округляется до целого числа, в результате чего перестает быть адекватным. Поэтому в модели учитываются периоды в 3 и 5 точек.