Автор работы: Пользователь скрыл имя, 31 Октября 2013 в 16:51, курс лекций
Анализ невременных данных.
Характеристики случайной величины.
Модель парной линейной регрессии.
Теорема Гаусса-Маркова.
Ковариационная матрица.
Дисперсионный анализ.
Модель множественной регрессии.
Спецификация модели.
Dummy – переменные, фиктивные переменные.
При моделировании временных рядов часто приходится учитывать корреляцию во времени, т.е.зависимость от прошлых значений. При моделировании временного ряда с автокорреляцией случайные остатки не будут близки к нормальным. Т.е.не выполнится основное требование теоремы Гаусса-Маркова, т.е.для такой модели полученные оценки коэффициентов не будут стремится к истинным значениям, т.е.прогноз, полученный по такой модели будет слишком оптимистичным.
Для учета зависимости от прошлых значений используют оператор сдвига
Для того, чтобы найти зависимость между текущим значением и значением на 1 шаг назад по времени, рассматривают коэффициент корреляции между исходным рядом и . Например: ряд выглядит следующим образом:
= =
Если необходимо определить связь
между текущим значением и
значением 2 шага во времени назад, то
рассматривается коэффициент
По аналогии находится зависимость от более дальних шагов по времени.
Существует несколько основных методов выделения сезонных и циклических колебаний. К ним относятся:
1.Рассчет сезонной компоненты
и построение аддитивной или
мультипликативной модели
аддитивная модель коммуникативная модель
2.Анализ сезонности с помощью автокорреляционной функции.
Уt |
D7 |
D30 |
Y1 |
. |
|
Y2 |
. |
|
Y3 |
. |
|
Y4 |
. |
|
Y5 |
. |
|
Y6 |
. |
|
Y7 |
. |
|
Y8 |
Y1 |
|
Y9 |
Y2 |
3.Моделирование с помощью рядо
При этом подходе строится зависимость (т.е.регрессионная модель), в которой в качестве характеристик сезонности включается пара sin и cos, характеризующая свои определенные периоды. В данном случае сезонная составляющая представляет собой:
- период сезонности.
Например. Если Тк=30 дням, то выявлена ежемесячная сезонность
- случайная ошибка
В этой модели неизвестными являются параметры, которые находятся с помощью МНК, но для того, чтобы оценки были близки к истинным значениям, необходимо выполнение тех же условий, что и для модели линейной регрессии, а именно
~ N – нормальное распределены.
Пример. По выборке о динамике урожайности зерновых культур, в одном из частных хозяйств была построена следующая трендовая модель
остатки оказались не близки к нормальным и их средняя была далеко от 0. Поскольку график остатков явно содержал сезонные составляющие, то для остатков была построена модель сезонных составляющих с помощью ряда Фурье (Microsoft Excel)
После построения модели оказалось близко к нормальному распределению, а их МО стало близко к 0.
Замечание. Так как большое количество параметров усложняет модель, делает ее сложно применимой и требует большого количества наблюдений, то при анализе сезонности необходимо выбрать основные значимые составляющие, т.е.выбрать только основные периоды сезонности (не больше 4-х периодов). Если вы выбрали 4 периода, то в модель включаются 4 пары sin и cos по одной паре на каждый период.
Пример. На основании данных «Сибнефть» был получен ряд котировок.
03.01.02 – 09.07.03
Но проводя анализ остатков было выяснено, что они не близки к нормальным, а их графический (визуальный) анализ позволил получить наличие сезонности. Дальнейший анализ выявил следующую сезонность. Оценки коэффициентов получены в Excel путем построения многомерной регрессии на соответствующие пары sin и cos.
из всех периодов сезонности были выбраны 2 самых значимых (162 и 109)
Т.к.оценивание производится с помощью Excel – Пакет анализ ® Регрессия, то по таблице итогов было видно, что все коэффициенты значимы, R2 – высокий, а сами выбранные периоды имели экономический смысл:
1-ый период: =109 дней » 4 месяца » 1/3 года
2-ой период: =162 дня » полгода.
Замечание 1. Если после построения регрессии на sin и cos из пары синуса и косинуса значима только одна составляющая, то в модель все равно включают пару.
Замечание 2. Основная сложность этого метода состоит в определении значимых периодов. Существует множество различных критериев для определения значимых периодов. Один из самых простых критериев состоит в следующем: выписываются все логически значимые периоды, исходя из сущности…
Т.е.строится множество пар синусов и косинусов (порядка 10-15), а дальше, строя на них регрессию, исходя из значимости коэффициентов, максимизации R2 и R2 нормированных, устраняют лишние (незначимые) пары синусов и косинусов.
Использование сезонных фиктивных компонент при моделировании сезонных колебаний
При этом подходе строится регрессионная модель, в которую помимо факторов времени включают сезонные фиктивные переменные. Каждому из сезонов соответствует определенное сочетание фиктивных переменных, а 1 из сезонов за базовый.
Например. Если имеются поквартальные данные, то вводятся 3 новые фиктивные переменные. 1-ый квартал считается за базовый.
N |
Yt |
D2 |
D3 |
D4 |
1 |
Y1 |
0 |
0 |
0 |
2 |
Y2 |
1 |
0 |
0 |
3 |
Y3 |
0 |
1 |
0 |
4 |
Y4 |
0 |
0 |
0 |
5 |
Y5 |
0 |
0 |
1 |
6 |
Y6 |
1 |
0 |
0 |
a0,a1,a2,b1,b2,b3 – коэффициенты, полученные МНК
a0+b1 – коэффициент, характеризующий изменение 2-го квартала по сравнению с 1-м.
a0+b2 - коэффициент, характеризующий изменение 3-го квартала по сравнению с 1-м.
a0+b3 - коэффициент, характеризующий изменение 3-го квартала по сравнению с 1-м.
Если коэффициент перед
Если же bi <0, то был спад по сравнению с 1-ым кварталом.
b1,b2,b3 могут иметь разные знаки.
Этот метод удобен для выявления явных простых сезонностей (квартальная, годовая зависимость), но с помощью него не удастся выявить сложную зависимость.
Автокорреляция – это зависимость текущих значений ряда от предыдущих. Для учета автокорреляции строятся динамические экономические модели, т.е.матем.модели, которые в определенный момент времени учитывают значение входящих в них переменных, относящихся к настоящему и предыдущему моменту времени.
Например. Линейная авторегрессионная модель ДЭМ.
Используется в финансах, торговле.
Замечание. - лагированные значения ряда.
Лаг – шаг во времени.
При построении ДЭМ часть лагированных значений может отсутствовать. При построении ДЭМ основной сложностью является нахождение оценок коэффициентов, т.к. МНК не применим. В этом случае для оценки коэффициентов используют метод максимума правдоподобия, обобщенный МНК и т.д.
Обобщением автокорреляционной модели служит Модель распределенных лагов.
При построении такой модели в правой части учитываются не только лагированные значения самого временного ряда, но и лагированные значения другого самостоятельного временного ряда. Линейная модель в данном виде может выглядеть следующим образом:
Например. ВВПt=a0+a1ВВПt-1+b1ДенМt-1+
ДенМ – денежная масса
a0,а1,b1,b2,c1 – вполне определенные числа, получаемые по выборке. Они характеризуют связь сегодняшнего значения ВВП с прошлым.
- остатки.
Модель считается хорошей, если остатки распределены нормально.
~ N; E( )=0; cov( " i¹j
Замечание. В правой части в моделях распределения лагов, т.е.в качестве регрессоров не могут участвовать значения других временных рядов в тот же момент времени.
Т.е.строить такую зависимость без выполнения определенных условий нельзя.
, т.к.оценки коэффициентов
Такую модель можно рассматривать, если предварительно с помощью либо экономико-логических рассуждений, либо с помощью тестов на причинно-следственную связь было получено, что Yt – это следствие изменения Zt.
Например. Без всяких тестов можно строить модель следующего вида. Цена на золотые украшения в ювелирном магазине равна: Рз.укр-а0+а1Кзt+а2Квt
Тестом на причинно-следственную связь может являться тест Гренджера, который проверяет сразу следующую пару гипотез: 1)Yt служит причиной изменения Zt 2)Zt служит причиной изменения Yt
Особого рассмотрения требует ситуация, когда обе гипотезы принимаются, т.е.совместное влияние Y на Z. В этом случае наблюдается перекрестная взаимосвязь при изучении временных рядов, состоящих из валютного курса $ и евро.
В этом случае строится векторная модель, которая в аналитическом виде представляет собой систему линейных уравнений, которая может выглядеть следующим образом.
Замечание. Выбор наилучшего вида модели необходим для: 1)точного определения связи между явлениями 2)для более точного прогнозирования 3)для выявления настоящей истинной зависимости от прошлого.
При анализе данных во временных рядах могут встречаться резко отличающиеся от общей тенденции значения.
Рассмотрим изменения курса доллара во времени.
D
выброс
Выброс требует отдельного детального рассмотрения – выясняется, что этот период совпадает с событиями 11 сентября и ликвидацией последствий трагедии.
Пример на структурные изменения:
Курс рубля по отношению к евро.
Rub/EuR
Предвыборная и выборная неделя
Такие временные периоды принято называть выбросами или структурными изменениями.
Учитывать их можно следующим образом:
в период структурного изменения стоят единицы, а в остальных случаях – нули
Dt =
t |
D |
1 2 3 4 5 6 7 8 . . . |
0 0 0 0 0 1 1 1 0 0 . |
Бизнес-циклы в экономике
При анализе макроэкономических показателей необходимо учитывать, что любая экономика развивается по циклам.
Экономический цикл – последовательная смена одних и тех же фаз.
Циклы отличаются друг от друга по амплитуде колебаний, по продолжительности, но последовательность фаз всегда остается неизменной.
Экономические бюро каждой страны определяют, текущую фазу цикла.
Существует два подхода к определению фаз:
яма яма
В этом случае толчком к развитию считается кризис, т.к. во время кризиса люди начинают активно экономить средства и вкладывать их в недвижимость. Объем инвестиций растет, объем наличной денежной массы уменьшается, начинает замедляться инфляция, следовательно, получаем фазу подъема.
В различных отраслях экономики существуют свои бизнес-циклы. Например, в начале XX века американский ученый Н.Кузнецов выделил циклы в строительстве @ 15 лет.
Самые короткие циклы составляют 3-4 года.
Используются при формировании бюджета РФ. Балансируются следующим образом:
При формировании общей экономической политики существуют вида подхода, связвнных с бизнес-циклами:
длинные затяжные периоды роста
сменяются резким, коротким периодом
спада – выгодно
Ранее мы рассматривали переменные в моделях, которые являются независимыми и могут принимать дискретные значения. Например Хо или Х1 (фиктивные переменные), а вот зависимая переменная У предполагалась количественной. В то же время довольно часто интересует нас величина У, являющаяся дискретной. Выделим несколько типичных ситуаций.