Автор работы: Пользователь скрыл имя, 21 Января 2014 в 08:00, контрольная работа
Данный проект посвящён изучению структуры цен квартир Екатеринбурга на первичном и вторичном рынках. Согласно статистическим данным сайта http://ekb-city.com, на 29 апреля 2013 г. средняя цена предложения одного квадратного метра общей площади квартир, выставленных на продажу на вторичном рынке жилья в Екатеринбурге, составила 70 872 руб. Это значение практически не меняется с февраля. В течение трех месяцев средний по городу показатель колеблется вокруг отметки 70 800 руб./кв. м, то поднимаясь, то снижаясь на 0,1-0,2 %.
Введение 3
ОБЗОР ДАННЫХ 5
МОДЕЛЬ №1 LS PRICE C TOTSQ 10
МОДЕЛЬ №2 LS PRICE C TOTSQ ROOMS 14
МОДЕЛЬ №3 LS VRP C LS PRICE C TOTSQ ROOMS REGION YARD FLOOR 17
ЗАКЛЮЧЕНИЕ 20
Подставив оценки для коэффициентов в модель, получим:
PRICE = -479120,6 + 77495,14*TOTSQ
Проанализируем наличие гетероскедастичности. Тест Уайта с учетом взаимодействий (приведена основная часть таблицы) позволяет нам отвергнуть гипотезу об ее отсутствии на 5% уровне, поскольку Probability < 0.05.
Heteroskedasticity Test: White |
||||
F-statistic |
8.788300 |
Prob. F(1,38) |
0.0052 | |
Obs*R-squared |
7.513246 |
Prob. Chi-Square(1) |
0.0061 | |
Scaled explained SS |
36.66556 |
Prob. Chi-Square(1) |
0.0000 | |
Таким образом, у нас появилось основание пересмотреть значимость оценок параметров линейной регрессии. С учетом гетероскедастичности получим:
Таблица 5
Результаты оценивания модели №1 с учетом гетероскедастичности
Dependent Variable: PRICE |
||||
Method: Least Squares |
||||
Date: 06/18/13 Time: 22:58 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
White heteroskedasticity-consistent standard errors & covariance | ||||
No d.f. adjustment for standard errors & covariance | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-479120.6 |
359917.9 |
-1.331194 |
0.1911 |
TOTSQ |
77495.14 |
7299.201 |
10.61693 |
0.0000 |
R-squared |
0.908599 |
Mean dependent var |
4571625. | |
Adjusted R-squared |
0.906193 |
S.D. dependent var |
3537108. | |
S.E. of regression |
1083342. |
Akaike info criterion |
30.67771 | |
Sum squared resid |
4.46E+13 |
Schwarz criterion |
30.76215 | |
Log likelihood |
-611.5541 |
Hannan-Quinn criter. |
30.70824 | |
F-statistic |
377.7482 |
Durbin-Watson stat |
1.522901 | |
Prob(F-statistic) |
0.000000 |
|||
Как мы видим, переменная «Общая площадь» значима (p<0.05). Коэффициент при переменной TOTSQ, равный (примерно) 77495,14 означает, что по имеющимся наблюдениям при увеличении (уменьшении) общей площади на 1 единицу, Цена увеличивается (уменьшается) в среднем на 77495,14 ед. Свободный коэффициент (константа) стал незначим, интерпретацию ему давать не будем.
Полученная модель имеет довольно высокий, близкий к 1 коэффициент детерминации. Общее представление о качестве модели дает следующий график EViews:
Рисунок 1. Визуальный анализ качества модели.
Поскольку подогнанные значения (Fitted) расположены достаточно близко к истинным (Actual), можно предположить, что модель в целом соответствует данным. Тем не менее, видно, что есть ряд измерений, которые плохо описываются нашей моделью (резко выделяющиеся значения, выбросы). Прологарифмируем функцию и сделаем выводы.
Таблица 6
Анализ логарифмической функции
Dependent Variable: LOG(PRICE) |
||||
Method: Least Squares |
||||
Date: 06/18/13 Time: 23:01 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
11.09974 |
0.237598 |
46.71648 |
0.0000 |
LOG(TOTSQ) |
1.006271 |
0.058672 |
17.15075 |
0.0000 |
R-squared |
0.885593 |
Mean dependent var |
15.13851 | |
Adjusted R-squared |
0.882583 |
S.D. dependent var |
0.583356 | |
S.E. of regression |
0.199894 |
Akaike info criterion |
-0.333351 | |
Sum squared resid |
1.518392 |
Schwarz criterion |
-0.248907 | |
Log likelihood |
8.667016 |
Hannan-Quinn criter. |
-0.302819 | |
F-statistic |
294.1482 |
Durbin-Watson stat |
1.922317 | |
Prob(F-statistic) |
0.000000 |
|||
Как мы видим,
переменная «Общая площадь» значима (p<0.05).
Коэффициент при переменной TOTSQ, равный
(примерно) 1,001% означает, что по имеющимся
наблюдениям при увеличении (уменьшении)
общей площади на 1%, Цена увеличивается
(уменьшается) в среднем на 1,001%.
Основываясь на выводах из таблицы 3, добавим в нашу модель переменную ROOMS – комнаты, поскольку коэффициент корреляции между ней и ценой также достаточно велик. С добавлением второй объясняющей переменной в данном случае модель должна уточниться. Проверим это.
Таблица 7
Результаты оценивания модели №2
Dependent Variable: PRICE |
||||
Method: Least Squares |
||||
Date: 06/18/13 Time: 23:04 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-265920.3 |
398527.3 |
-0.667257 |
0.5087 |
TOTSQ |
82589.76 |
7141.681 |
11.56447 |
0.0000 |
ROOMS |
-234512.8 |
272312.6 |
-0.861190 |
0.3947 |
R-squared |
0.910395 |
Mean dependent var |
4571625. | |
Adjusted R-squared |
0.905551 |
S.D. dependent var |
3537108. | |
S.E. of regression |
1087043. |
Akaike info criterion |
30.70786 | |
Sum squared resid |
4.37E+13 |
Schwarz criterion |
30.83453 | |
Log likelihood |
-611.1572 |
Hannan-Quinn criter. |
30.75366 | |
F-statistic |
187.9608 |
Durbin-Watson stat |
1.572557 | |
Prob(F-statistic) |
0.000000 |
|||
Подставив оценки для коэффициентов в модель, получим:
PRICE = -265920,3+82589,76*TOTSQ-
Сначала сделаем анализ на наличие гетероскедастичности в модели:
Таблица 8
Проверка наличия гетероскедастичности с помощью критерия Уайта модели №2
Heteroskedasticity Test: White |
||||
F-statistic |
5.071329 |
Prob. F(2,37) |
0.0113 | |
Obs*R-squared |
8.605928 |
Prob. Chi-Square(2) |
0.0135 | |
Scaled explained SS |
39.34944 |
Prob. Chi-Square(2) |
0.0000 | |
Тест Уайта с учетом взаимодействий (приведена основная часть таблицы) позволяет нам отвергнуть гипотезу об отсутствии гетероскедастичности на 5% уровне, поскольку Probability < 0.05. Сделаем поправку на гетероскедастичность, получим следующие результаты:
Таблица 9
Результаты оценивания модели №2 с учетом гетероскедастичности
Dependent Variable: PRICE |
||||
Method: Least Squares |
||||
Date: 06/18/13 Time: 23:05 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
White heteroskedasticity-consistent standard errors & covariance | ||||
No d.f. adjustment for standard errors & covariance | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-265920.3 |
365795.7 |
-0.726964 |
0.4718 |
TOTSQ |
82589.76 |
11194.42 |
7.377764 |
0.0000 |
ROOMS |
-234512.8 |
258353.6 |
-0.907720 |
0.3699 |
R-squared |
0.910395 |
Mean dependent var |
4571625. | |
Adjusted R-squared |
0.905551 |
S.D. dependent var |
3537108. | |
S.E. of regression |
1087043. |
Akaike info criterion |
30.70786 | |
Sum squared resid |
4.37E+13 |
Schwarz criterion |
30.83453 | |
Log likelihood |
-611.1572 |
Hannan-Quinn criter. |
30.75366 | |
F-statistic |
187.9608 |
Durbin-Watson stat |
1.572557 | |
Prob(F-statistic) |
0.000000 |
|||
Сделаем заключения по модели: единственная значимая переменная модели – жилая площадь, а комнаты незначима. Коэффициент детерминации модели №2 незначительно улучшился, мы не получили ни одной дополнительной значимой переменной, следует попробовать ввести другую модель.
Есть и еще одно основание отвергнуть модель №2, скорее всего, в ней присутствует мультиколлинеарность, т.к., в данной модели по результатам анализа мы наблюдаем сильную значимость уравнения в целом (высокое фактическое значение F-статистики) при одновременно довольно маленьком значении t-статистики, во-вторых, на частичную мультиколлинеарность указывает сравнительно высокий коэффициент корреляции между двумя рассматриваемыми в этой модели независимыми переменными.
МОДЕЛЬ №3
LS VRP C LS PRICE C TOTSQ ROOMS REGION YARD FLOOR
Добавим в нашу модель три оставшиеся переменные, таким образом, включим в модель все пять наших объясняющих переменных и посмотрим на результаты.
Таблица 10
Результаты оценивания модели №3
Dependent Variable: PRICE |
||||
Method: Least Squares |
||||
Date: 06/18/13 Time: 23:06 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-637309.8 |
455645.8 |
-1.398696 |
0.1710 |
TOTSQ |
71733.36 |
8582.672 |
8.357929 |
0.0000 |
ROOMS |
-228780.5 |
293149.7 |
-0.780422 |
0.4405 |
REGION |
1100206. |
563046.4 |
1.954023 |
0.0590 |
YARD |
538804.4 |
447409.4 |
1.204276 |
0.2368 |
FLOOR |
104287.0 |
60719.87 |
1.717511 |
0.0950 |
R-squared |
0.922500 |
Mean dependent var |
4571625. | |
Adjusted R-squared |
0.911103 |
S.D. dependent var |
3537108. | |
S.E. of regression |
1054608. |
Akaike info criterion |
30.71272 | |
Sum squared resid |
3.78E+13 |
Schwarz criterion |
30.96605 | |
Log likelihood |
-608.2543 |
Hannan-Quinn criter. |
30.80431 | |
F-statistic |
80.94241 |
Durbin-Watson stat |
1.758006 | |
Prob(F-statistic) |
0.000000 |
|||
Информация о работе Исследование зависимости стоимости квартир от некоторых факторов