Прогнозирование частоты упоминаний закрытых городов в еженедельной газете г. Сарова "Городской курьер"

Автор работы: Пользователь скрыл имя, 20 Июня 2013 в 15:21, курсовая работа

Описание работы

Целью данной работы является построение адекватной модели прогноза ряда.
Исходным рядом служит частота встречаемости названий закрытых административно-территориальных преобразований в еженедельных выпусках газеты г. Сарова «Городской курьер» с 3 июня 1997 года по 11 мая 2005 года. Таким образом, ряд содержит 414 точек. Каждое значение ряда представляет собой сумму частоты встречаемости следующих ЗАТО Минатома: Трехгорного, Снежинска, Лесного, Заречного, Зеленогорска, Озерска, Новоуральска, Железногорска, Северска во всех статьях данного выпуска

Содержание работы

Цель и задачи работы 3
Выбор методов прогнозирования 3
Анализ сезонности ряда с помощью Спектрального (Фурье) анализа 4
Прогнозирование ряда методом АРИМА с интервенцией 5
Разложение ряда на компоненты методом Сезонной корректировки X-11 (метод Census II) 11
Прогнозирование ряда без шумовой компоненты методом Экспоненциального сглаживания 15
Окончательная оценка прогнозов: сравнение прогнозных значений с истинными 17

Файлы: 1 файл

SasaPrognoz_kursovaya.doc

— 636.50 Кб (Скачать файл)

 

График 7. Тренд-циклическая компонента ряда частоты упоминаний названий ЗАТО в газете

 

 

График 8. Сезонная компонента ряда частоты упоминаний названий ЗАТО в газете

 

 

График 9. Шумовая компонента ряда частоты упоминаний названий ЗАТО в газете

 

 

Точные значения тренд-циклической  и сезонной компонент представлены в таблицах 5, 6. Из суммы этих значений получаем новый ряд без шумовой  компоненты.

 

Таблица 5. Значения тренд-циклической компоненты ряда частоты упоминаний названий ЗАТО в газете

 

 

Таблица 6. Значения сезонной компоненты ряда частоты упоминаний названий ЗАТО в газете

 

 

Получившийся ряд представлен на графике 10. В целом он напоминает исходный ряд с уменьшенной дисперсией.

 

График 10. Ряд частоты упоминаний названий ЗАТО в газете без шумовой компоненты

 

Прогнозирование ряда без шумовой  компоненты методом Экспоненциального сглаживания

Для построения прогноза ряда частоты  упоминаний названий ЗАТО без влияния внешних воздействий был выбран метод Экспоненциального сглаживания. Такой выбор был сделан по следующей причине – после удаления шумовой компоненты ряд стал более простым, следовательно, к нему можно применить метод экспоненциального сглаживания.

Для построения модели прогноза необходимо определить наилучшие параметры сглаживания Alpha и Delta. Это делается в диалоговом окне Экспоненциального сглаживания на закладке Grid Search. Наиболее подходящими значениями параметров сглаживания являются Alpha=0,9 и Delta=0,1. Именно при таких параметрах модели абсолютная ошибка минимальна.

 

Таблица 7. Выбор параметров сглаживания ряда без шумовой компоненты

 

 

В диалоговом окне Экспоненциального сглаживания задаем параметры модели: аддитивная сезонность, Alpha=0,9 и Delta=0,1. Значения сезонных факторов берем из ряда, выделенного с помощью Сезонной корректировки Х-11. Вследствие того, что сезонный лаг при выделении сезонной компоненты составлял 12 точек, выставляем именно это значение.

 

Рисунок 7. Диалоговое окно метода Экспоненциального сглаживания

 

 

Результаты построения прогноза методом  Экспоненциального сглаживания  представлены на графике 11 и в таблице 8. Прогноз свидетельствует о том, что в каждом из последующих 25 выпусков газеты названия закрытых городов Минатома будут упоминаться не более 1 раза. Если сравнить значения этого прогноза с прогнозом методом АРИМА прерванная, то видно, что прогноз исходного ряда методом АРИМА прерванная дает более высокие значения частоты упоминаний ЗАТО (в среднем от 1 до 2-ух упоминаний). Это можно объяснить большей дисперсией исходного ряда, которая после удаления шумовой компоненты была уменьшена.

 

График 11. Прогноз ряда без шумовой компоненты методом Экспоненциального сглаживания

 

 

Таблица 8. Прогноз ряда без шумовой компоненты методом Экспоненциального сглаживания

 

Case

Smoothed Series

 

Case

Smoothed Series

361

0,636121

 

374

0,873598

362

0,873598

 

375

0,977321

363

0,977321

 

376

0,987118

364

0,987118

 

377

1,180708

365

1,180708

 

378

1,075610

366

1,075610

 

379

0,646008

367

0,646008

 

380

0,459315

368

0,459315

 

381

0,414849

369

0,414849

 

382

0,306892

370

0,306892

 

383

0,426400

371

0,426400

 

384

0,610936

372

0,610936

 

385

0,636121

373

0,636121

     

 

Распределение остатков близко к нормальному, следовательно, модель прогноза можно считать адекватной.

 

Гистограмма 5. Распределение остатков ряда без шумовой компоненты

 

 

График 12. Распределение остатков ряда без шумовой компоненты

 

Окончательная оценка прогнозов: сравнение прогнозных значений с истинными

Окончательное оценивание любого прогноза происходит со временем, когда прогноз сбывается либо нет. В данной работе прогноз был построен двумя способами: методом АРИМА прерванная, модель включала 2 параметра авторегрессии, сезонный лаг равный 3-ем и разность 5; методом Экспоненциального сглаживания с предварительным вычитанием шумовой компоненты (модель включала параметры сглаживания Alpha=0,9 и Delta=0,1, сезонные факторы, выделенные методом Сезонной корректировки Х-11 с лагом 12). Прогнозы незначительно отличаются друг от друга (в среднем примерно на 1 значение).

Сравнение прогнозируемой частоты  упоминаний названий ЗАТО в газете «Городской курьер» представлено в  таблице 9 и на графике 13.

 

Таблица 9. Сравнение прогнозируемых значений с истинными

 

Дата выпуска  газеты

Прогноз исходного  ряда методом АРИМА с интервенцией

Прогноз ряда без шумовой компоненты методом  Экспоненциального сглаживания

Истинные значения ряда

Разность прогноза методом АРИМА с интервенцией и истинными значениями

(по модулю)

Разность прогноза методом Экспоненциального сглаживания и истинными значениями ряда

(по модулю)

18 мая 2005

1,885509

0,636121

4

2,114491

3,363879

25 мая 2005

2,091222

0,873598

0

2,091222

0,873598

1 июня 2005

1,012622

0,977321

3

1,987378

2,022679

8 июня 2005

0,991724

0,987118

14

13,008276

13,012882

15 июня 2005

-0,001354

1,180708

1

1,001354

0,180708

22 июня 2005

1,886256

1,07561

0

1,886256

1,07561

29 июня 2005

2,091365

0,646008

2

0,091365

1,353992

6 июля 2005

1,012555

0,459315

0

1,012555

0,459315

13 июля 2005

0,991709

0,414849

0

0,991709

0,414849

20 июля 2005

-0,001348

0,306892

0

0,001348

0,306892

27 июля 2005

1,886257

0,4264

0

1,886257

0,4264

3 августа 2005

2,091364

0,610936

0

2,091364

0,610936

10 августа 2005

1,012555

0,636121

9

7,987445

8,363879

17 августа 2005

0,991709

0,873598

     

24 августа 2005

-0,00135

0,977321

     

31 августа 2005

1,886257

0,987118

     

7 сентября 2005

2,091364

1,180708

     

14 сентября 2005

1,012555

1,07561

0

1,012555

1,07561

21 сентября 2005

0,991709

0,646008

0

0,991709

0,646008

28 сентября 2005

-0,00135

0,459315

0

0,00135

0,459315

5 октября 2005

1,886257

0,414849

3

1,113743

2,585151

12 октября 2005

2,091364

0,306892

0

2,091364

0,306892

19 октября 2005

1,012555

0,4264

6

4,987445

5,5736

26 октября 2005

0,991709

0,610936

17

16,008291

16,389064

2 ноября 2005

-0,00135

0,636121

     
   

62,357477

59,501259


 

График 13. Сравнение прогнозируемых значений с истинными

 

 

Частота упоминаний ЗАТО в газете известна не по всем 25 выпускам газеты, но сравнение провести все равно можно. Разница прогнозируемых значений с истинными велика, из чего можно заключить, что прогнозы не сбылись. Разница между истинными значениями ряда и прогнозом методом Экспоненциального сглаживания чуть меньше разницы истинных значений с прогнозируемыми методом АРИМА с интервенцией. Но говорить о более адекватном прогнозе нельзя.

Внешние воздействия на частоту  упоминаний ЗАТО в газете оказались  непредсказуемыми. В эти 25 недель произошли следующие события:

  • научно-практический семинар по вопросам особенностей формирования бюджетов ЗАТО
  • празднование 55-летия города Железногорска
  • финал конкурса «Учитель, воспитатель года» среди закрытых городов

Неспособность дать адекватный прогноз не является недостатком предложенных моделей прогноза, просто логика ряда слишком подвержена событиям извне, поэтому, чтобы построить адекватный прогноз, необходимо учитывать ряд других факторов, как например, план поездок чиновников закрытых городов в другие ЗАТО или график совещаний Минатома и других структур по проблемам ЗАТО. Предположительно, частота упоминаний ЗАТО будет коррелировать с частотой упоминаний ЗАТО в графике совещаний Минатома и др. с запаздыванием не более 7 дней (т.е. событие будет описано в ближайшем выпуске газеты).

 

 

 

 

 

 

 

1 Интервенцию на 407 шаге невозможно учитывать в данной модели, т. к. необходимо минимум 10 точек после интервенции, а ряд составляют только 414 точек.

Периоды 82,8 и 16,5686 точек, выделенные с  помощью Спектрального анализа, не учитываются в данной модели, т. к. первый из них слишком велик (при округлении до 83 точек в ряд не укладываются необходимые для анализа 5 циклов), а второй слишком грубо округляется до целого числа, в результате чего перестает быть адекватным. Поэтому в модели учитываются периоды в 3 и 5 точек.




Информация о работе Прогнозирование частоты упоминаний закрытых городов в еженедельной газете г. Сарова "Городской курьер"