Автор работы: Пользователь скрыл имя, 25 Января 2013 в 10:54, курсовая работа
Целью написания данной работы является выявление определенной зависимости между выбранными экономическими показателями на основе построения эконометрической регрессионной модели, с также изучение способов выявления гетероскедастичности и ее коррекции.
Среди основных задач выделяются:
построение качественной и адекватной модели линейной регрессии и, как следствие, доказательство справедливости теоретического обоснования существования данной зависимости;
исследование проблемы гетероскедастичности с помощью тестов Голдфельда-Квандта и Бреуша-Пагана, позволяющих определить наличие или отсутствие гетероскедастичности в модели.
Введение……………………………………………………3
Теоретический раздел…………………………………4
Аналитический раздел………………………………..7
Построение базовой регрессионной модели и оценка её качества………………………………...…..7
Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Голдфельда-Квандта и Бреуша-Пагана………………………………….……15
Устранение гетероскедастичности в модели…………………………………….………………..17
Заключение………………………………………………19
Список использованных источников…..…….20
Табл. 1
Перед построением модели регрессии следует проверить каждый из временных рядов на стационарность, а в случае нестационарности - определить порядок интегрированности. Исходя из анализа коррелограмм наших временных рядов показателей ,все ряды однозначно определяются как нестационарные временные ряды
1) Ряд выручки нестационарен в уровнях, но интегрирован в первых разностях относительно тренда.
2) Ряд индекса промышленного производства также нестационарен в уровнях, но интегрирован в первых разностях относительно тренда.Также присутствует сезонность
3) Ряд средне-экспортных цен нестационарен в уровнях ,но интегрирован во вторых разностях относительно тренда.
4) Ряд курса доллара нестационарен в уровнях ,но интегрирован во впервых разностях.
По данным Таблицы 1 построим исходную модель с помощью пакета Eviews
Получим следующее уравнение построенной модели:
Y = 234591.65283 + 405040.779693*INDEX - 18799.6880198*KURS + 44.3987522823*PRICE
Где,
Y- выручка «Газпрома»(млрд рос.рубл)
INDEX-индекс промышленного производства (%)
KURS-Курс доллара к российскому рублю ( рос. рубль)
PRICE- средне-экспортные цены на природный газ (рос. рубл)
Dependent Variable: Y |
||||
Method: Least Squares |
||||
Date: 12/12/12 Time: 15:56 |
||||
Sample: 2004Q1 2011Q4 |
||||
Included observations: 32 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
234591.7 |
246829.2 |
0.950421 |
0.3500 |
INDEX |
405040.8 |
82385.98 |
4.916380 |
0.0000 |
KURS |
-18799.69 |
9437.540 |
-1.992011 |
0.0562 |
PRICE |
44.39875 |
15.57229 |
2.851138 |
0.0081 |
R-squared |
0.874727 |
Mean dependent var |
669171.9 | |
Adjusted R-squared |
0.861304 |
S.D. dependent var |
304348.9 | |
S.E. of regression |
113345.1 |
Akaike info criterion |
26.23073 | |
Sum squared resid |
3.60E+11 |
Schwarz criterion |
26.41395 | |
Log likelihood |
-415.6917 |
Hannan-Quinn criter. |
26.29146 | |
F-statistic |
65.17039 |
Durbin-Watson stat |
1.898518 | |
Prob(F-statistic) |
0.000000 |
|||
|
Проверим модель на нормальное распределение
Статистика Жака-Бера и соответствующее ей Р- значение говорят об нормальности ошибок рассматриваемой модели при выбранном уровне значимости α=0,05.В модели нормальное распределение.
Проверим на значимость коэффициенты уравнения регрессии. Для этого оценим t-статистику:
Y = 234591.65283 + 405040.779693*INDEX - 18799.6880198*KURS + 44.3987522823*PRICE
(t) (0.95) (4.9) (-1.99) (2.85)
(не знач) (знач) (знач) (знач)
Используем в данном случае уровень значимости . Тогда критическое значение t-статистики соответственно:
t0.1,32=1,310
Значения t-статистик рассматриваемых переменных больше критического значения (критерий Стьюдента), следовательно делаем вывод о их значимости. По анализу исследованных t-статистик и коэффициента детерминации R-квадрат делаем предварительный вывод об адекватности построенной модели.
Продолжая оценивать общее качество модели, используем критерий Фишера:
Н0: =0
Н1: >0
Так как F-наблюдаемое больше F-критического, принимаем гипотезу Н1, согласно которой модель адекватна.
Хотелось бы отметить тот факт, что курс не значим. Для этого я его скорректировала . Причины не значимости могут быть различны. Это обусловлено
После скорректированного курса получилось новое уравнение.
Y = 405586.530379 + 467557.749252*INDEX - 25627.4753493*KURS + 34.0225898772*PRICE(-1)
(t) (1,544)
(5,37)
(знач) (знач) (знач) (знач)
Dependent Variable: Y |
||||
Method: Least Squares |
||||
Date: 12/13/12 Time: 21:55 |
||||
Sample (adjusted): 2004Q2 2011Q4 |
||||
Included observations: 31 after adjustments |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
405586.5 |
262569.3 |
1.544684 |
0.1341 |
INDEX |
467557.7 |
86958.41 |
5.376797 |
0.0000 |
KURS |
-25627.48 |
10109.86 |
-2.534900 |
0.0174 |
PRICE(-1) |
34.02259 |
18.21195 |
1.868146 |
0.0726 |
R-squared |
0.847653 |
Mean dependent var |
682505.0 | |
Adjusted R-squared |
0.830725 |
S.D. dependent var |
299729.0 | |
S.E. of regression |
123317.5 |
Akaike info criterion |
26.40283 | |
Sum squared resid |
4.11E+11 |
Schwarz criterion |
26.58786 | |
Log likelihood |
-405.2438 |
Hannan-Quinn criter. |
26.46314 | |
F-statistic |
50.07561 |
Durbin-Watson stat |
1.850715 | |
Prob(F-statistic) |
0.000000 |
|||
Оценим общее качество модели снова:
Н0: R-квадрат=0
Н1: R-квадрат>0
Так как F-наблюдаемое больше F-критического, принимаем гипотезу Н1, согласно которой модель адекватна. Поскольку значение F-наблюдаемого велико, можно сделать предположение о наличии мультиколлинеарности, что будет проверено мною в дальнейшем.
Выполним проверку регрессионной
модели на мультиколлинеарность.
Построим корреляционную матрицу коэффициентов:
index |
kurs |
prise | |
index |
1 |
||
kurs |
0,401157614 |
1 |
|
price |
0,837368118 |
0,222301242 |
1 |
=0,40345
=-0,2269
=0,8377
Делаем вывод об отсутствии высокой зависимости (коллинеарности) между переменными в двух случаев. Следует заметить коллинеарность у третьего коэффициента (kurs).Следовательно, в модели присутствует мультиколлинеарность. Эта проблема оказывает определенное влияние на качество модели, однако ее устранение не является обязательным этапом, поэтому перейдем к дальнейшему исследованию качества регрессионной модели.
Проверим модель на присутствие автокорреляции.
Для этого будем использовать тест Дарбина-Уотсона. Суть метода определения автокорреляции на основе статистики Дарбина-Уотсона состоит в вычислении статистики DW и на основе ее величины осуществлении выводов об автокорреляции. Статистика Дарбина-Уотсона может принимать значения 0 ≤ DW ≤ 4, которые могут указать на наличие либо отсутствие автокорреляции. Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое - об ее наличии, была построена таблица критических точек распределения Дарбина-Уотсона. По ней для заданного уровня значимости α, числа наблюдений n и количества объясняющих переменных m определяются два значения: dl - нижняя граница и du - верхняя граница и делаются выводы по следующей схеме:
0 ≤ DW < dl - существует положительная автокорреляция,
dl ≤ DW < du - вывод о наличии автокорреляции не определен,
du ≤ DW < 4 - du - автокорреляция отсутствует,
4 - du ≤ DW < 4 - dl - вывод о наличии автокорреляции не определен,
4 - dl ≤ DW ≤ 4 - существует отрицательная автокорреляция.
Приведем значение статистики:
DW=1.850715
Значения критических точек
при уровне значимости :
dl=1.244
du=1.650
4-dl=2.756
4-du=2.35
По приведенной выше схеме получается, что du ≤ DW < 4 - du, откуда можно сделать вывод об отсутствии автокорреляции. Таким образом, согласно статистике Дарбина-Уотсона построенная регрессионная модель автокорреляции не имеет
Делаем вывод об отсутствии автокорреляции, т.к. значение статистики
DW в данном случае близко к 2.
Исследование проблемы гетероскедастичности с помощью тестов Бреуша-Пагана-Годфри и Гольфельда-Квандта
Проведем тест Гольфельда-Квандта и проверим гипотезу о наличии гетероскедастичности в остатках в данной регрессионной модели.
Порядок выполнения следующий:
1. Формулируются основная (нулевая) и альтернативная гипотезы.
При тестировании модели на гетероскедастичность ошибок основная гипотеза – это всегда гипотеза о гомоскедастичности (т. е. о том, что гетероскедастичности нет: дисперсия ошибок одинакова во всех наблюдениях).
Альтернативная гипотеза (о гетероскедастичности) в каждом тесте своя. В тесте Гольдфельда-Квандта это гипотеза о монотонной зависимости дисперсии ошибки от какого-нибудь фактора.
2.По фактору, от которого может зависеть дисперсия ошибки, требуется упорядочить наблюдения (в порядке возрастания или убывания).
3. Исключаем из рассмотрения С центральных наблюдений. С –
это любое целое число из интервала [n/5; n/3], где n – число наблюдений в выборке . В данном случае С должно быть четным, чтобы оставшиеся две группы имели одинаковое число наблюдений.
4. Для каждой из оставшихся групп в отдельности переоцениваем
регрессию. Получим две суммы квадратов остатков .
5.Разделить суммы квадратов остатков и сравнить с критическим значением.
a)Проверим гомоскедастичность по фактору kurs
Находим остаточную дисперсию S1 = 398397950640,39
Аналогично определим остаточную дисперсию
S2 = 1379208888767,35
Найдем отношение
S2 : S1 =3,461887509
Определим критическое значение для теста Гольдфельда–Квандта .
F крит=F0,05;12;12=2,69
Так как S2 : S1 = 3,46 > Fкрит, то нарушается предпосылка о ра-
венстве дисперсий, т. е. о гомоскедастичности остатков по переменной kurs
б) Проверим гомоскедастичность по фактору index. Действуя
получим следующие величины остаточных дисперсий S1 =28968984846,07
S2 = 478517712719,08
Так как отношение S2 : S1 = 16,52> Fкрит, то нарушается предпосылка о равенстве дисперсий, т. е. о гомоскедастичности остатков по переменной index
в)Проверим гомоскедастичность по фактору price.
S1=55631765194,66
S2=391896539143,55
S2:S1=7,044474>46 > Fкрит, то нарушается предпосылка о ра-
венстве дисперсий, т. е. о гомоскедастичности остатков по переменной price
Далее проведем тест Бреуша-Годфри-Пагана
Heteroskedasticity Test: Breusch-Pagan-Godfrey | ||||
F-statistic |
4.635620 |
Prob. F(3,27) |
0.0097 | |
Obs*R-squared |
10.53888 |
Prob. Chi-Square(3) |
0.0145 | |
Scaled explained SS |
6.762455 |
Prob. Chi-Square(3) |
0.0799 | |
Test Equation: |
||||
Dependent Variable: RESID^2 |
||||
Method: Least Squares |
||||
Date: 12/14/12 Time: 00:15 |
||||
Sample: 2004Q2 2011Q4 |
||||
Included observations: 31 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-5.59E+10 |
3.19E+10 |
-1.749142 |
0.0916 |
INDEX |
1.59E+10 |
1.06E+10 |
1.499377 |
0.1454 |
KURS |
1.46E+09 |
1.23E+09 |
1.190825 |
0.2441 |
PRICE(-1) |
217008.7 |
2214797. |
0.097981 |
0.9227 |
R-squared |
0.339964 |
Mean dependent var |
1.32E+10 | |
Adjusted R-squared |
0.266627 |
S.D. dependent var |
1.75E+10 | |
S.E. of regression |
1.50E+10 |
Akaike info criterion |
49.82001 | |
Sum squared resid |
6.07E+21 |
Schwarz criterion |
50.00504 | |
Log likelihood |
-768.2102 |
Hannan-Quinn criter. |
49.88033 | |
F-statistic |
4.635620 |
Durbin-Watson stat |
2.264538 | |
Prob(F-statistic) |
0.009682 |
|||