Анализ и прогнозирование объемов продаж сетей автозаправок

Автор работы: Пользователь скрыл имя, 11 Марта 2014 в 21:06, курсовая работа

Описание работы

Совокупность существующих методов анализа таких рядов наблюдений называется анализом временных рядов. Основной чертой, выделяющей анализ временных рядов среди других видов статистического анализа, является существенность порядка, в котором производятся наблюдения. Если во многих задачах наблюдения статистически независимы, то во временных рядах они, как правило, зависимы, и характер этой зависимости может определяться положением наблюдений в последовательности.

Файлы: 1 файл

курсовой проэкт(курс 3 семестр 1).docx

— 834.90 Кб (Скачать файл)

а) Сезонные эффекты на фоне тренда

 Для аддитивной  модели  xt = trt + St + εt оценка:

                  (11)

 

Если необходимо, чтобы сумма сезонных эффектов равнялась 0, то переходят к скорректированным оценкам сезонных эффектов:

                                   (12)

 

Для мультипликативной модели  xt = trt * St * εt:

                  (13)

 

б) При наличии в ряде циклической компоненты (метод скользящих средних)

Идея метода: каждое значение исходного ВР заменяется средним значением на интервале времени, длина которого выбирается заранее. Выбранный интервал как бы скользит вдоль ряда.

Скользящее среднее ( ) при медианном сглаживании: t=med (xt-m,xt-m+1, …,xt+m)

При средне арифметическом сглаживании:  

 

t=1/(2m+1)(xt-m+xt-m+1+…+xt+m),  если р – четный,

t=1/(2m)(1/2*xt-m+xt-m+1+…+1/2*xt+m)  если р – нечетный.

 

Для аддитивной модели xt = trt +Ct + St + εt.

Для упрощения обозначений: начнем нумерацию величин с единицы, изменим нумерацию исходного ряда так, чтобы величине соответствовал член xt.

                        (14)

 – скользящее среднее  с периодом p, построенное по xt.

Для мультипликативной модели – перейти к логарифмам и получить мультипликативную модель.

xt = trt · Ct · St · εt                                             (15)

yt = log xt, dt = log trt,  gt = log Ct,  rt = log St,  δt = log εt        (16)

yt = dt + gt + rt + δt                                           (17)

 

2) Удаление  сезонной компоненты (сезонное выравнивание)

 

а) При наличии оценок сезонной компоненты:

Для аддитивной модели – путем вычитания из начальных значений ряда полученных сезонных оценок .

Для мультипликативной модели – путем деления начальных значений ряда на соответствующие сезонные оценки и умножением на 100%.

 

б) Применение разностных операторов

yt = xt – xt-p = xt = (1 – Bp)xt,                              (18)

где В – оператор сдвига назад.

Разностный оператор второго порядка:

yt = xt –2xt-p + xt-2p = 2 xt = (1 – Bp)2 xt = (1 – 2Bp + B2р)2 xt    (19)

Если ВР одновременно содержит тренд и сезонную компоненту, то их удаление возможно с помощью последовательного применения простых и сезонных разностных операторов. Порядок их применения не существенен:

pxt = (xt – xt-p) = (xt – xt-1) – (xt-p – xt-p-1)                    (20)

p xt = p(xt – xt-1) = (xt – xt-1) – (xt-p – xt-1-p)                  (21)

 

3) Прогнозирование  с помощью сезонной компоненты:

Для аддитивной модели:

                                               (22)

Для мультипликативной модели:

                                               (23)

 

 

Модели временного ряда ARIMA(p,d,q).

Идентификация моделей, оценка параметров, исследование адекватности модели, прогнозирование.

Случайный процесс x(t) называется процессом авторегрессии-скользящего среднего порядков p и q (ARMA(p,q)), если для него выполняется соотношение:

                  (24)

 

Нестационарные технические и экономические процессы могут быть описаны модифицированной моделью ARMA(p,q). Для удаления тренда можно использовать разностные операторы.

 

Пусть даны две последовательности U=(…,U-1,U0,U1,…) и V=(…,V-1, V0,V1,V2,…) такие, что:

 означает  ,

 означает  и т.д.

Тогда процесс AR(p) представляется в виде ,

MA(q): ,                                       (25)

ARMA(p,q):                               (26)

B можно использовать как разностный оператор, т.е. Vt=Ut – Ut-1, t

эквивалентно V=(1-B)U

Для разностей второго порядка:

z =(1-B)V=(1-B)2U                                       (27)

 

Таким образом получим модель авторегрессии-проинтегрированного скользящего среднего порядков p, d и q (ARIMA(p,d,q)),  определяемую уравнениями:

                                      (28)

                                             (29)

где – разностный оператор порядка d; x=(1-B)dx.

 

Идентифицировать модель – определить ее параметры p, d и q. Для идентификации модели служат графики частных автокорреляционных (АКФ) и частных автокорреляционных функций (ЧАКФ).

АКФ. k-й член АКФ определяется по формуле:

                                        (30)

Параметр k называют лагом. На практике k < n/4. График АКФ – коррелограмма. Если полученный ряд остатков нестационарный, то по коррелограмма можно определить причины не стационарности.

Прогнозирование. При прогнозировании необходимо получить детерминированные значения ВР по уже имеющимся формулам, а затем рассчитать случайные значения по подобранной модели и скорректировать детерминированные значения на величину случайных значений.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Описание модуля Statictica 

Time Series/Forecasting

 

Общее описание

 

Для активизации модуля в меню Statistica надо выбрать последовательность команд Advanced Linear/Nonlinear Models -* Time Series/Forecasting. Откроется стартовое окно модуля (рис.18.1). После открытия файла и выбора переменной в информационной части окна в поле Variable появятся имена переменных, а в поле Long variable name — расширенное имя.

Значок слева от имени переменной означает, что переменные закрыты на ключ и не могут быть удалены без прерывания анализа. Весь дальнейший диалог происходит именно с этими переменными, которые можно преобразовывать, анализировать, но нельзя удалять из текущего анализа. В процессе работы для выбора наиболее подходящего преобразования ряды многократно преобразовываются, и чтобы не хранить лишнюю информацию (неудачные преобразования), их следует удалить. Для этого служит кнопка Delete highlighted variable (удалить высвеченные переменные). Если нам для проведения дальнейших исследований (возможно и в других модулях STATISTICA) необходимо сохранить некоторые преобразования, надо воспользоваться кнопкой Save variables (сохранить переменные).

В поле Number of backups per variable (число резервов для переменных) определяют число преобразований текущего диалога в информационной части окна Если число преобразований превысит указанное число, то система сделает запрос — сохранить ли очередное преобразование.

Кнопка Select cases (выбрать наблюдения) предназначена для выбора под множества случаев для анализа.

Кнопка OK (transformations, autocorrelations, plots) (преобразования, автокорреляции, графики) открывает специальное окно для преобразования ряда.

Остальные кнопки, расположенные в центре стартового окна, — функциональные, определяющие различные .методы (процедуры) анализа временных рядов.

  • ARIMA & autocorrelation functions (модель авторегрессии и нроинтефиро-ванного скользящего среднего — сокращенно АРПСС).
  • Interrupted time series analysis (анализ прерванных временных рядов или модели АРПСС с интервенцией).
  • Exponential smoothing & forecasting (экспоненциальное сглаживание и прогнозирование).
  • Seasonal decomposition (Census 1) (сезонная декомпозиция).
  • Spectral (Fourier) analysis (спектральный (Фурье) анализ).
  • XII/Y2k (Census 1) — montly (12-месячная сезонная корректировка).
  • Quartenly (квартальная сезонная корректировка).
  • Distributed Lags Analysis (анализ распределенных лагов).

 

Рис.2. Главное диалоговое окно

На вкладке Missing Data система предлагает различные возможности для заполнения пропущенных значений:

•   Overall mean — общее среднее.

•   Interpolation from adjacent points — интерполяция по соседним точкам.

•   Mean of N adjacent points — среднее по соседним точкам.

•   Median of Nadjacent points — медиана соседних точек.

•   Predicted values from linear trend regression — предсказанные значения с учетом линейной регрессии.

Прогнозирование временных рядов — и наука, и искусство, для того чтобы делать правильные (адекватные) прогнозы, необходимы знания и опыт. Надо строить прогнозы различными способами, сопоставлять результаты и только после этого выбирать ту наилучшую модель, которая наиболее правдоподобно прогнозирует ряд.

Рассмотрим прогнозирование при помощи модели авторегрессии и проинтегрированного скользящего среднего.

Рис.3.Окно настройки заполнения пустых значений

ARIMA & autocorrelation functions

Этот важный класс параметрических моделей, описывающих и нестационарные ряды, имеет большое практическое значение. В программе STATISTICA ARIMA реализована в методологии Бокса и Дженкинса. Большинство временных рядов, например в экономике, описываются моделью ARIMA — АРПСС. Модель может включать константу. Перед построением модели ряд можно подвергнуть преобразованию, которое автоматически будет отменено после построения прогноза по АРПСС, при этом предсказанные значения и их стандартные ошибки будут выражены через значения исходного (а не преобразованного) ряда. Уникальной особенностью модели АРПСС является способность анализировать модели с длинными периодами сезонности (с лагом до 30). Стандартный набор результатов содержит оценки параметров, стандартные ошибки и корреляции. Предсказанные значения могут быть представлены в числовой и графической форме и добавлены к исходному ряду. Имеются многочисленные дополнительные функции для исследования остатков модели АРПСС, в том числе большой набор графических средств.

Нажмите кнопку ARIMA & autocorrelation functions. Откроется диалоговое окно процедуры (рис. 18.2).

Анализ временного ряда начнем с графической иллюстрации ряда. Выберите вкладку Review Series (просмотреть серии). Верхняя часть окна — информационная, здесь записывается имя ряда и его преобразования.

Рис.4.Главное меню метода  ARIMA

В левой части окна в рамке Review and plot variables (просмотреть переменные и построить график) расположены следующие кнопки и опции:

•   Display/plot subset only — показать на экране / построить график только подмножества;

•   Review highlighted variables — просмотреть высвеченные переменные;

•   Review multiple variables — просмотреть несколько переменных.

•   Plot — график;

•   Plot two var list with different scales — графики переменных из двух списков в различных шкалах.

В правой части окна в рамке Label data points with (метки точек данных) расположены опции обозначений наблюдений на графике (Case names — имена наблюдений, Case numbers — номера наблюдений, Dates fmm a var — значения переменной, имя которой указывается при помощи кнопки Variable) и кнопки для построения различных типов вероятностных графиков.

Перед построением графиков необходимо выставить нужные обозначения шкал X и У. Для этого надо отметить нужные значения минимума (номер наблюдения, с которого строится график) и шага по шкале X в опции Scale Xaxis in plots manually (min, step), а также выбрать метку Case names (пометить именами наблюдений) для шкалы У в опциях Label data points with.

Далее с помощью кнопки Plot рядом с кнопкой Review highlighted variables (просмотр выделенной переменной) построим график ряда, который позволит произвести предварительную, визуальную оценку данных ряда.

 

Рис.5. Пример построения графика временного ряда

Для построения «качественного» прогноза уровни исследуемого показателя (в нашем случае объемы перевозок) обязательно должны быть сопоставимы и однородны, а для выявления тенденций, кроме этого, устойчивы и полны, т.е. количество наблюдений должно быть достаточно велико.

Сопоставимость предполагает формирование всех уровней по одной и той же методике, использование одинаковой единицы измерения и шага наблюдений.

Требование однородности данных предполагает отсутствие сильных изломов тенденций, а также нетипичных, аномальных наблюдений. При поиске тенденций бывает целесообразно отбросить часть прошлых данных, если они отражают уже утратившую силу закономерность прошлого развития. Наличие аномальных (резко выделяющихся) наблюдений приводит к искажению результатов. Формально она проявляется как сильный скачок (спад) с последующим приблизительным восстановлением предыдущего уровня.

Устойчивость характеризует преобладание закономерности над случайностью в изменении уровней ряда. На графиках устойчивых временных рядов даже визуально прослеживается закономерность, на графиках неустойчивых рядов изменения последовательных уровней представляются хаотичными, и поэтому поиск закономерностей в формировании значений уровней таких рядов лишен смысла.

Требование полноты данных обусловливается тем, что закономерность может быть обнаружена лишь при наличии минимально допустимого объема наблюдений.

 

Spectral (Fourier) analysis/ Спектральный анализ(Анализ Фурье)

Для нахождения такого рода периодичностей используйте спектральный анализ. Для этого воспользуйтесь диалогом Spectral (Fourier) analysis (Фурье, спектральный анализ). Появится одноименное диалоговое окно. Нажмите кнопку ОК (одномерный анализ Фурье). Откроется диалоговое окно с результатами анализа (рис.). Установите опцию Plot by (график) в положение Period (период) и нажмите кнопку Periodogram (периодограмма). Программа построит график.

В модуле Time Series/Forecasting реализовано два вида сезонной декомпозиции: классическая сезонная декомпозиция (Census I) и так называемый XII/Y2k (Census 1) — montly (12-месячная сезонная корректировка), разработанный в Бюро переписей США и максимально приближенный к стандартам, применяемым в США. Отличие последнего от классической сезонной декомпозиции заключается в том, что в нем производится корректировка на различные дни недели и на различное количество дней в месяце (месячная корректировка), а также на месяцы с экстремальными наблюдениями (квартальная корректировка).

Информация о работе Анализ и прогнозирование объемов продаж сетей автозаправок