Исследование зависимости стоимости квартир от некоторых факторов

Автор работы: Пользователь скрыл имя, 21 Января 2014 в 08:00, контрольная работа

Описание работы

Данный проект посвящён изучению структуры цен квартир Екатеринбурга на первичном и вторичном рынках. Согласно статистическим данным сайта http://ekb-city.com, на 29 апреля 2013 г. средняя цена предложения одного квадратного метра общей площади квартир, выставленных на продажу на вторичном рынке жилья в Екатеринбурге, составила 70 872 руб. Это значение практически не меняется с февраля. В течение трех месяцев средний по городу показатель колеблется вокруг отметки 70 800 руб./кв. м, то поднимаясь, то снижаясь на 0,1-0,2 %.

Содержание работы

Введение 3
ОБЗОР ДАННЫХ 5
МОДЕЛЬ №1 LS PRICE C TOTSQ 10
МОДЕЛЬ №2 LS PRICE C TOTSQ ROOMS 14
МОДЕЛЬ №3 LS VRP C LS PRICE C TOTSQ ROOMS REGION YARD FLOOR 17
ЗАКЛЮЧЕНИЕ 20

Файлы: 1 файл

Эконометрика.docx

— 97.41 Кб (Скачать файл)

 

Подставив оценки для коэффициентов в модель, получим:

PRICE = -479120,6 + 77495,14*TOTSQ

Проанализируем  наличие гетероскедастичности. Тест Уайта с учетом взаимодействий (приведена основная часть таблицы) позволяет нам отвергнуть гипотезу об ее отсутствии на 5% уровне, поскольку Probability < 0.05.

 

 

 

Heteroskedasticity Test: White

 
         
         

F-statistic

8.788300

Prob. F(1,38)

0.0052

Obs*R-squared

7.513246

Prob. Chi-Square(1)

0.0061

Scaled explained SS

36.66556

Prob. Chi-Square(1)

0.0000

         
         

Таким образом, у нас появилось основание  пересмотреть значимость оценок параметров линейной регрессии. С учетом гетероскедастичности получим:

Таблица 5

Результаты оценивания модели №1 с учетом гетероскедастичности

 

 

Dependent Variable: PRICE

   

Method: Least Squares

   

Date: 06/18/13   Time: 22:58

   

Sample: 1 40

     

Included observations: 40

   

White heteroskedasticity-consistent standard errors & covariance

No d.f. adjustment for standard errors & covariance

         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

-479120.6

359917.9

-1.331194

0.1911

TOTSQ

77495.14

7299.201

10.61693

0.0000

         
         

R-squared

0.908599

Mean dependent var

4571625.

Adjusted R-squared

0.906193

S.D. dependent var

3537108.

S.E. of regression

1083342.

Akaike info criterion

30.67771

Sum squared resid

4.46E+13

Schwarz criterion

30.76215

Log likelihood

-611.5541

Hannan-Quinn criter.

30.70824

F-statistic

377.7482

Durbin-Watson stat

1.522901

Prob(F-statistic)

0.000000

     
         
         

 

Как мы видим, переменная «Общая площадь» значима (p<0.05). Коэффициент при переменной TOTSQ, равный (примерно) 77495,14 означает, что по имеющимся наблюдениям при увеличении (уменьшении) общей площади на 1 единицу, Цена увеличивается (уменьшается) в среднем на 77495,14 ед. Свободный коэффициент (константа) стал незначим, интерпретацию ему давать не будем. 

Полученная  модель имеет довольно высокий, близкий к 1 коэффициент детерминации. Общее представление о качестве модели дает следующий график EViews:

Рисунок 1. Визуальный анализ качества модели.

 Поскольку подогнанные значения (Fitted) расположены достаточно близко к истинным (Actual), можно предположить, что модель в целом соответствует данным. Тем не менее, видно, что есть ряд измерений, которые плохо описываются нашей моделью (резко выделяющиеся значения, выбросы). Прологарифмируем функцию и сделаем выводы.

 

 

 

 

 

 

 

 

 

 

Таблица 6

Анализ  логарифмической функции

Dependent Variable: LOG(PRICE)

 

Method: Least Squares

   

Date: 06/18/13   Time: 23:01

   

Sample: 1 40

     

Included observations: 40

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

11.09974

0.237598

46.71648

0.0000

LOG(TOTSQ)

1.006271

0.058672

17.15075

0.0000

         
         

R-squared

0.885593

Mean dependent var

15.13851

Adjusted R-squared

0.882583

S.D. dependent var

0.583356

S.E. of regression

0.199894

Akaike info criterion

-0.333351

Sum squared resid

1.518392

Schwarz criterion

-0.248907

Log likelihood

8.667016

Hannan-Quinn criter.

-0.302819

F-statistic

294.1482

Durbin-Watson stat

1.922317

Prob(F-statistic)

0.000000

     
         
         

Как мы видим, переменная «Общая площадь» значима (p<0.05). Коэффициент при переменной TOTSQ, равный (примерно) 1,001%  означает, что по имеющимся наблюдениям при увеличении (уменьшении) общей площади на 1%, Цена увеличивается (уменьшается) в среднем на 1,001%.  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

МОДЕЛЬ №2

LS PRICE C TOTSQ ROOMS

Основываясь на выводах из таблицы 3, добавим в нашу модель переменную ROOMS – комнаты, поскольку коэффициент корреляции между ней и ценой также достаточно велик. С добавлением второй объясняющей переменной в данном случае модель должна уточниться. Проверим это.

Таблица 7

Результаты оценивания модели №2

 

Dependent Variable: PRICE

   

Method: Least Squares

   

Date: 06/18/13   Time: 23:04

   

Sample: 1 40

     

Included observations: 40

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

-265920.3

398527.3

-0.667257

0.5087

TOTSQ

82589.76

7141.681

11.56447

0.0000

ROOMS

-234512.8

272312.6

-0.861190

0.3947

         
         

R-squared

0.910395

Mean dependent var

4571625.

Adjusted R-squared

0.905551

S.D. dependent var

3537108.

S.E. of regression

1087043.

Akaike info criterion

30.70786

Sum squared resid

4.37E+13

Schwarz criterion

30.83453

Log likelihood

-611.1572

Hannan-Quinn criter.

30.75366

F-statistic

187.9608

Durbin-Watson stat

1.572557

Prob(F-statistic)

0.000000

     
         
         

Подставив оценки для коэффициентов в модель, получим:

PRICE = -265920,3+82589,76*TOTSQ-234512,8*ROOMS

Сначала сделаем анализ на  наличие гетероскедастичности в модели:

Таблица 8

Проверка  наличия гетероскедастичности с помощью критерия Уайта модели №2

 

Heteroskedasticity Test: White

 
         
         

F-statistic

5.071329

Prob. F(2,37)

0.0113

Obs*R-squared

8.605928

Prob. Chi-Square(2)

0.0135

Scaled explained SS

39.34944

Prob. Chi-Square(2)

0.0000

         
         

Тест  Уайта с учетом взаимодействий (приведена  основная часть таблицы) позволяет  нам отвергнуть гипотезу об отсутствии гетероскедастичности на 5% уровне, поскольку Probability < 0.05. Сделаем поправку на гетероскедастичность, получим следующие результаты:

 

Таблица 9

Результаты  оценивания модели №2 с учетом гетероскедастичности

 

Dependent Variable: PRICE

   

Method: Least Squares

   

Date: 06/18/13   Time: 23:05

   

Sample: 1 40

     

Included observations: 40

   

White heteroskedasticity-consistent standard errors & covariance

No d.f. adjustment for standard errors & covariance

         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

-265920.3

365795.7

-0.726964

0.4718

TOTSQ

82589.76

11194.42

7.377764

0.0000

ROOMS

-234512.8

258353.6

-0.907720

0.3699

         
         

R-squared

0.910395

Mean dependent var

4571625.

Adjusted R-squared

0.905551

S.D. dependent var

3537108.

S.E. of regression

1087043.

Akaike info criterion

30.70786

Sum squared resid

4.37E+13

Schwarz criterion

30.83453

Log likelihood

-611.1572

Hannan-Quinn criter.

30.75366

F-statistic

187.9608

Durbin-Watson stat

1.572557

Prob(F-statistic)

0.000000

     
         
         

 

Сделаем заключения по модели: единственная значимая переменная модели – жилая площадь, а комнаты незначима. Коэффициент детерминации модели №2 незначительно улучшился, мы не получили ни одной дополнительной значимой переменной, следует попробовать ввести другую модель.

Есть  и еще одно основание отвергнуть модель №2, скорее всего, в ней присутствует мультиколлинеарность, т.к., в данной модели по результатам анализа мы наблюдаем сильную значимость уравнения в целом (высокое фактическое значение F-статистики) при одновременно довольно маленьком значении t-статистики, во-вторых, на частичную мультиколлинеарность указывает сравнительно высокий коэффициент корреляции между двумя рассматриваемыми в этой модели независимыми переменными.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

МОДЕЛЬ №3

LS VRP C LS PRICE C TOTSQ ROOMS REGION YARD FLOOR

Добавим в нашу модель три оставшиеся переменные, таким образом, включим  в модель все пять наших объясняющих  переменных и посмотрим на результаты.

Таблица 10

Результаты оценивания модели №3

 

Dependent Variable: PRICE

   

Method: Least Squares

   

Date: 06/18/13   Time: 23:06

   

Sample: 1 40

     

Included observations: 40

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

-637309.8

455645.8

-1.398696

0.1710

TOTSQ

71733.36

8582.672

8.357929

0.0000

ROOMS

-228780.5

293149.7

-0.780422

0.4405

REGION

1100206.

563046.4

1.954023

0.0590

YARD

538804.4

447409.4

1.204276

0.2368

FLOOR

104287.0

60719.87

1.717511

0.0950

         
         

R-squared

0.922500

Mean dependent var

4571625.

Adjusted R-squared

0.911103

S.D. dependent var

3537108.

S.E. of regression

1054608.

Akaike info criterion

30.71272

Sum squared resid

3.78E+13

Schwarz criterion

30.96605

Log likelihood

-608.2543

Hannan-Quinn criter.

30.80431

F-statistic

80.94241

Durbin-Watson stat

1.758006

Prob(F-statistic)

0.000000

     
         
         

Информация о работе Исследование зависимости стоимости квартир от некоторых факторов