Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Голдфельда-Квандта и Бреуша-Пагана

Автор работы: Пользователь скрыл имя, 25 Января 2013 в 10:54, курсовая работа

Описание работы

Целью написания данной работы является выявление определенной зависимости между выбранными экономическими показателями на основе построения эконометрической регрессионной модели, с также изучение способов выявления гетероскедастичности и ее коррекции.
Среди основных задач выделяются:
построение качественной и адекватной модели линейной регрессии и, как следствие, доказательство справедливости теоретического обоснования существования данной зависимости;
исследование проблемы гетероскедастичности с помощью тестов Голдфельда-Квандта и Бреуша-Пагана, позволяющих определить наличие или отсутствие гетероскедастичности в модели.

Содержание работы

Введение……………………………………………………3
Теоретический раздел…………………………………4
Аналитический раздел………………………………..7
Построение базовой регрессионной модели и оценка её качества………………………………...…..7
Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Голдфельда-Квандта и Бреуша-Пагана………………………………….……15
Устранение гетероскедастичности в модели…………………………………….………………..17
Заключение………………………………………………19
Список использованных источников…..…….20

Файлы: 1 файл

Курсовая работа Щербина М.В (Восстановлен).docx

— 220.35 Кб (Скачать файл)

Табл. 1

Перед построением модели регрессии следует  проверить каждый из временных рядов на стационарность, а в случае нестационарности - определить порядок интегрированности. Исходя из анализа коррелограмм наших временных рядов показателей ,все ряды однозначно определяются как нестационарные временные ряды

1) Ряд выручки нестационарен в уровнях, но интегрирован в первых разностях относительно тренда.

2) Ряд индекса промышленного производства также нестационарен в уровнях, но интегрирован в первых разностях относительно тренда.Также присутствует сезонность

3) Ряд средне-экспортных цен нестационарен в уровнях ,но интегрирован во вторых разностях относительно тренда.

4) Ряд курса доллара нестационарен в уровнях ,но интегрирован во впервых разностях.

 
 

По  данным  Таблицы 1 построим исходную модель с помощью пакета Eviews

Получим следующее  уравнение построенной модели:

 

Y = 234591.65283 + 405040.779693*INDEX - 18799.6880198*KURS + 44.3987522823*PRICE


 

 Где,

Y- выручка «Газпрома»(млрд рос.рубл)

INDEX-индекс промышленного производства (%)

KURS-Курс доллара к российскому рублю ( рос. рубль)

PRICE- средне-экспортные цены на природный газ (рос. рубл)

 

 

 

 

Dependent Variable: Y

   

Method: Least Squares

   

Date: 12/12/12   Time: 15:56

   

Sample: 2004Q1 2011Q4

   

Included observations: 32

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.

         
         

C

234591.7

246829.2

0.950421

0.3500

INDEX

405040.8

82385.98

4.916380

0.0000

KURS

-18799.69

9437.540

-1.992011

0.0562

PRICE

44.39875

15.57229

2.851138

0.0081

         
         

R-squared

0.874727

Mean dependent var

669171.9

Adjusted R-squared

0.861304

S.D. dependent var

304348.9

S.E. of regression

113345.1

Akaike info criterion

26.23073

Sum squared resid

3.60E+11

Schwarz criterion

26.41395

Log likelihood

-415.6917

Hannan-Quinn criter.

26.29146

F-statistic

65.17039

Durbin-Watson stat

1.898518

Prob(F-statistic)

0.000000

     
         
         

 

 

       

 

Проверим  модель на нормальное распределение

 

 

Статистика  Жака-Бера и соответствующее ей Р- значение говорят об  нормальности ошибок рассматриваемой модели при выбранном уровне значимости α=0,05.В модели нормальное распределение.

 

Проверим  на значимость коэффициенты уравнения  регрессии. Для этого оценим t-статистику:

 

Y = 234591.65283 + 405040.779693*INDEX - 18799.6880198*KURS + 44.3987522823*PRICE


        (t)   (0.95)                      (4.9)                          (-1.99)                      (2.85)

              (не знач)               (знач)                         (знач)                        (знач)

 

 

Используем  в данном случае уровень значимости . Тогда критическое значение t-статистики соответственно:

t0.1,32=1,310

Значения  t-статистик рассматриваемых переменных больше критического значения (критерий Стьюдента), следовательно делаем вывод о их значимости. По анализу исследованных t-статистик и коэффициента детерминации R-квадрат делаем предварительный вывод об адекватности построенной модели.

Продолжая оценивать общее качество модели, используем критерий Фишера:


                                                     

 


 

 

 

 

 

Н0: =0

Н1: >0

Так как F-наблюдаемое больше F-критического, принимаем гипотезу Н1, согласно которой модель адекватна.

Хотелось  бы отметить тот факт, что курс не значим. Для этого я его скорректировала . Причины  не значимости могут быть различны. Это обусловлено

После скорректированного курса  получилось новое уравнение.

 

Y = 405586.530379 + 467557.749252*INDEX - 25627.4753493*KURS + 34.0225898772*PRICE(-1)


     (t)   (1,544)                      (5,37)                          (-2,534)                      (1,86)


           (знач)                       (знач)                         (знач)                        (знач)


 

Dependent Variable: Y

   

Method: Least Squares

   

Date: 12/13/12   Time: 21:55

   

Sample (adjusted): 2004Q2 2011Q4

 

Included observations: 31 after adjustments

 
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

405586.5

262569.3

1.544684

0.1341

INDEX

467557.7

86958.41

5.376797

0.0000

KURS

-25627.48

10109.86

-2.534900

0.0174

PRICE(-1)

34.02259

18.21195

1.868146

0.0726

         
         

R-squared

0.847653

Mean dependent var

682505.0

Adjusted R-squared

0.830725

S.D. dependent var

299729.0

S.E. of regression

123317.5

Akaike info criterion

26.40283

Sum squared resid

4.11E+11

Schwarz criterion

26.58786

Log likelihood

-405.2438

Hannan-Quinn criter.

26.46314

F-statistic

50.07561

Durbin-Watson stat

1.850715

Prob(F-statistic)

0.000000

     
         
         

 

 

 

 

     

 

 

 

 

 

 

 

    Оценим общее качество модели снова:

 

                                                     


 

 


 

 

 

 

Н0: R-квадрат=0

Н1: R-квадрат>0

Так как F-наблюдаемое больше F-критического, принимаем гипотезу Н1, согласно которой модель адекватна. Поскольку значение F-наблюдаемого велико, можно сделать предположение о наличии мультиколлинеарности, что будет проверено мною в дальнейшем.

 

Выполним проверку регрессионной  модели на мультиколлинеарность.  
Построим корреляционную матрицу коэффициентов:

 

index

kurs

prise

index

1

   

kurs

0,401157614

1

 

price

0,837368118

0,222301242

1


 

=0,40345

 

 

 

=-0,2269

 

 

=0,8377

 

Делаем вывод  об отсутствии высокой зависимости (коллинеарности) между переменными в двух случаев. Следует заметить коллинеарность   у третьего коэффициента (kurs).Следовательно, в модели присутствует мультиколлинеарность. Эта проблема оказывает определенное влияние на качество модели, однако ее устранение не является обязательным этапом, поэтому перейдем к дальнейшему исследованию качества регрессионной модели.

 

Проверим модель на присутствие  автокорреляции.

  Для этого будем использовать тест Дарбина-Уотсона. Суть метода определения автокорреляции на основе статистики Дарбина-Уотсона состоит в вычислении статистики DW и на основе ее величины осуществлении выводов об автокорреляции.  Статистика Дарбина-Уотсона может принимать значения 0 ≤ DW ≤ 4, которые могут указать на наличие  либо  отсутствие  автокорреляции. Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое - об ее наличии, была построена таблица критических точек распределения Дарбина-Уотсона. По ней для заданного уровня значимости α, числа наблюдений n и количества  объясняющих  переменных m  определяются  два  значения: dl - нижняя граница и du - верхняя граница и делаются выводы по следующей схеме:

0  ≤ DW < dl - существует положительная автокорреляция,

dl  ≤ DW < du - вывод о наличии автокорреляции не определен,

du ≤ DW < 4 - du - автокорреляция отсутствует,

4 - du ≤ DW < 4 - dl - вывод о наличии автокорреляции не определен,

4 - dl ≤ DW ≤ 4 -  существует отрицательная автокорреляция.

 

Приведем  значение статистики:

DW=1.850715

Значения критических точек

при уровне значимости :

dl=1.244

du=1.650

4-dl=2.756

4-du=2.35

 

По приведенной  выше схеме получается, что du ≤ DW < 4 - du, откуда можно сделать вывод об отсутствии автокорреляции. Таким образом, согласно статистике Дарбина-Уотсона построенная регрессионная модель автокорреляции не имеет

Делаем вывод об отсутствии автокорреляции, т.к. значение статистики

DW в данном случае близко к 2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Исследование  проблемы гетероскедастичности с помощью тестов  Бреуша-Пагана-Годфри и Гольфельда-Квандта

 

Проведем  тест Гольфельда-Квандта и проверим гипотезу о наличии гетероскедастичности в остатках в данной регрессионной  модели.

Порядок выполнения следующий:

1. Формулируются  основная (нулевая) и альтернативная  гипотезы.

При тестировании модели на гетероскедастичность ошибок основная гипотеза – это всегда гипотеза о гомоскедастичности (т. е. о том, что гетероскедастичности нет: дисперсия ошибок одинакова во всех наблюдениях).

Альтернативная  гипотеза (о гетероскедастичности) в каждом тесте своя. В тесте Гольдфельда-Квандта это гипотеза о монотонной зависимости дисперсии ошибки от какого-нибудь фактора.

2.По фактору, от которого может зависеть дисперсия ошибки, требуется упорядочить наблюдения (в порядке возрастания или убывания).

3. Исключаем из рассмотрения С центральных наблюдений. С –

это любое целое число  из интервала [n/5; n/3], где n – число  наблюдений в выборке . В данном случае С должно быть четным, чтобы оставшиеся две группы имели одинаковое число наблюдений.

4. Для каждой из оставшихся групп в отдельности переоцениваем

регрессию. Получим две  суммы квадратов остатков .

5.Разделить суммы квадратов остатков и сравнить с критическим значением.

a)Проверим гомоскедастичность по фактору kurs

Находим остаточную дисперсию S1 = 398397950640,39

Аналогично определим остаточную дисперсию

S2 = 1379208888767,35

Найдем отношение

S2 : S1 =3,461887509

Определим критическое значение для теста Гольдфельда–Квандта  .

F крит=F0,05;12;12=2,69

Так как S2 : S1 = 3,46 > Fкрит, то нарушается предпосылка о ра-

венстве дисперсий, т. е. о  гомоскедастичности остатков по переменной kurs

б) Проверим гомоскедастичность по фактору index. Действуя

получим следующие величины остаточных дисперсий S1 =28968984846,07

S2 = 478517712719,08

Так как отношение S2 : S1 = 16,52> Fкрит, то нарушается предпосылка о равенстве дисперсий, т. е. о гомоскедастичности остатков по переменной index

в)Проверим гомоскедастичность по фактору price.

S1=55631765194,66

S2=391896539143,55

S2:S1=7,044474>46 > Fкрит, то нарушается предпосылка о ра-

венстве дисперсий, т. е. о  гомоскедастичности остатков по переменной price

 

Далее проведем тест Бреуша-Годфри-Пагана

Heteroskedasticity Test: Breusch-Pagan-Godfrey

         
         

F-statistic

4.635620

Prob. F(3,27)

0.0097

Obs*R-squared

10.53888

Prob. Chi-Square(3)

0.0145

Scaled explained SS

6.762455

Prob. Chi-Square(3)

0.0799

         
         
         

Test Equation:

     

Dependent Variable: RESID^2

   

Method: Least Squares

   

Date: 12/14/12   Time: 00:15

   

Sample: 2004Q2 2011Q4

   

Included observations: 31

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

-5.59E+10

3.19E+10

-1.749142

0.0916

INDEX

1.59E+10

1.06E+10

1.499377

0.1454

KURS

1.46E+09

1.23E+09

1.190825

0.2441

PRICE(-1)

217008.7

2214797.

0.097981

0.9227

         
         

R-squared

0.339964

Mean dependent var

1.32E+10

Adjusted R-squared

0.266627

S.D. dependent var

1.75E+10

S.E. of regression

1.50E+10

Akaike info criterion

49.82001

Sum squared resid

6.07E+21

Schwarz criterion

50.00504

Log likelihood

-768.2102

Hannan-Quinn criter.

49.88033

F-statistic

4.635620

Durbin-Watson stat

2.264538

Prob(F-statistic)

0.009682

     
         
         

Информация о работе Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Голдфельда-Квандта и Бреуша-Пагана