Автор работы: Пользователь скрыл имя, 11 Марта 2013 в 11:05, контрольная работа
Задание по эконометрическому моделированию стоимости квартир в Московской области:
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х.
Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.
1.Задача 1. Эконометрическое моделирование стоимости квартир в Московской области…………………………..……………......
3
2.Задача 2 Исследовать динамику экономического показателя на основе анализа одномерного временного ряда……………….
=α+β*хi=-11,70880054+1,
= - 11,70880054+1,5425936570*135,
Вероятность реализации точечного прогноза теоретически равна нулю, поэтому рассчитаем доверительный интервал прогноза с заранее заданной вероятностью α=0,1
Величину отклонения от линии регрессии вычисляют по формуле εi=уi- , Вычисляем εi или берем значение = из протокола регрессионного анализа Excel (пересечение SS – сумма квадратов и Остаток) для фактора Х3 (Таблица 4)
Величину стандартной ошибки Sε находят по формуле:
Sε= = 27,85
Или берем значение стандартной ошибки из протокола регрессионного анализа Excel (Стандартная ошибка) для фактора Х3 (Таблица 4).
Табличный коэффициент t-критерия (tα.) Стьюдента при степени свободы ν=(n-2)=40-2=38 и заданном уровне значимости α=0,1 берется из таблицы значений или определяется с использованием надстройки Excel:
tα. = 1,685954461 при (α=0,1; ν=38)
Доверительный интервал для прогнозов индивидуальных значений уi определяется из соотношения:
упрогн = .
упрогн € [ ŷ прогн ± Ui ]
Ui =
U(x=135,6, ,n=40,α=0,1)= 27,85*1,685954461* =50,72
Прогнозное значение = 196,07 с вероятностью 80% будет находиться между верхней границей, равной 196,07 + 50,72 =246,79 и нижней границей, равной 197,46 - 50,72 =146,74
Представим графически фактические и модельные значения точки прогноза:
Ответ: Получили однофакторную модель со значимым фактором Х3
Y = − 11,70+ 1,543Х3
Коэффициент детерминации (R2=0,714957) высокий хорошее качество модели. 71% вариации зависимой переменной Y учтено в модели и обусловлено влиянием включенного фактора Х3 (общая площадь квартиры). Значимость модели (F=6,62395E-12) - высокая, фактор значим. Вычисляем табличное значение t-критерия Стьюдента=2,028 (при вероятности=0,05) и сравниваем с табличными значениями t-статистика=9,76>2,028 - tтабл., фактор Х3 – значим.
В нашей задаче βх3=1,5426 (коэффициент при Х3) показывает, что при увеличении общей площади квартиры на 1 м2, цена квартиры увеличится на 1,5426 тыс. долл. α = -11,70 - постоянная величина уравнения имеет отрицательное значение и экономической значимости не имеет, так как при общей площади квартиры равной нулю, цена квартиры тоже равной нулю.
Качество модели осталось прежним, модель уравнения парной регрессии со значимым фактором не изменилась (см. п.4).
Решение: Используя пошаговую регрессию (метод исключения), построим модель формирования цены квартиры в зависимости от значимых факторов.
Шаг 1: Построим модель линейной регрессии формирования цены квартиры от всех трех факторов (Х3, Х5, Х6):
Y = 14,038 + 1,696Х3 + 0,084Х5 - 3,815Х6
Проанализируем полученные данные, используя протокол линейной регрессии (Таблица 9):
ВЫВОД ИТОГОВ |
||||
Регрессионная статистика |
||||
Множественный R |
0,772092 |
|||
R-квадрат |
0,596126 |
|||
Нормированный R-квадрат |
0,56247 |
|||
Стандартная ошибка |
34,06006 |
|||
Наблюдения |
40 |
|||
Дисперсионный анализ |
||||
df |
SS |
MS | ||
Регрессия |
3 |
61643,25 |
20547,75 | |
Остаток |
36 |
41763,16 |
1160,088 | |
Итого |
39 |
103406,4 |
||
Коэффициенты |
Стандартная ошибка |
t-статистика | ||
Y-пересечение |
1,173842 |
24,15774 |
0,048591 | |
Переменная X 1 |
1,218234 |
0,179279 |
6,795194 | |
Переменная X 2 |
-0,75183 |
1,510865 |
-0,49762 | |
Переменная X 3 |
1,178291 |
2,599217 |
0,453326 | |
t-критерий Стьюдента |
2,024394 |
Коэффициент детерминации (R2=0,596126) и (R2 нормированный=0,56247) высокий, значимость модели (F=1,42292E-10) хорошая, вычисляем табличное значение t-критерия Стьюдента=2,0264 (при вероятности=0,05) и сравниваем с табличными значениями t-статистика, значим только один фактор Х3, такой моделью пользовать нельзя, так как все факторы, используемые в модели, должны быть значимыми. Исключаем фактор Х5 с самым низким значением по модулю t-статистика=-0,49.
Шаг 2: Построим модель линейной регрессии формирования цены квартиры от двух факторов (Х3, Х6):
Y = 14,04 + 1,696Х3 - 3,759Х6
Проанализируем полученные данные, используя протокол линейной регрессии
(Таблица 10):
ВЫВОД ИТОГОВ |
|||
Регрессионная статистика |
|||
Множественный R |
0,859112903 |
||
R-квадрат |
0,73807498 |
||
Нормированный R-квадрат |
0,723916871 |
||
Стандартная ошибка |
27,05586127 |
||
Наблюдения |
40 |
||
Дисперсионный анализ |
|||
df |
SS |
MS | |
Регрессия |
2 |
76321,68483 |
38160,84242 |
Остаток |
37 |
27084,72627 |
732,0196288 |
Итого |
39 |
103406,4111 |
|
Коэффициенты |
Стандартная ошибка |
t-статистика | |
Y-пересечение |
14,04035138 |
18,89059717 |
0,743245502 |
X3 |
1,696496871 |
0,175540046 |
9,664443592 |
X6 |
-3,759364352 |
2,080305652 |
-1,807121155 |
t-критерий Стьюдента |
2,028192447 |
Коэффициент детерминации (R2=0,73807498) и (R2 нормированный=0,723916871) высокий. Значимость модели (F=1,72296E-11) улучшилась, по сравнению с первой. Вычисляем табличное значение t-критерия Стьюдента=2,028 (при вероятности = 0,05) и сравниваем с табличными значениями t-статистика, значим только один фактор Х3, такой моделью пользовать нельзя, так как все факторы, используемые в модели, должны быть значимыми. Исключаем фактор Х6 с самым низким значением по модулю t-статистика= -1,807.
Сравним дополнительно верхние и нижние пределы:
Нижние 95% |
Верхние 95% | |
Y-пересечение |
-24,23563394 |
52,3163367 |
X3 |
1,340818956 |
2,052174786 |
X6 |
-7,974463953 |
0,455735248 |
Пределы фактора Х6 включают 0 – значит фактор не значим, исключаем его из модели.
Шаг 3: Построим однофакторную модель со значимым фактором Х3:
Y = -13,11+ 1,54*Х3
Проанализируем полученные данные, используя протокол линейной регрессии
(Таблица 4):
Регрессионная статистика | ||||||
Множественный R |
0,8455513 | |||||
R-квадрат |
0,714957 | |||||
Нормированный R-квадрат |
0,70745587 | |||||
Стандартная ошибка |
27,8507645 | |||||
Наблюдения |
40 | |||||
Значимость F | ||||||
6,62395E-12 | ||||||
Коэффициенты |
Стандартная ошибка |
t-статистика | ||||
Y-пересечение |
-13,10880054 |
11,78859601 |
-1,111989972 | |||
X3 |
1,542593657 |
0,158006505 |
9,762849051 | |||
t-критерий Стьюдента табл. |
2,024394147 |
Коэффициент детерминации (R2=0,714957) высокий хорошее качество модели. 71% вариации зависимой переменной Y учтено в модели и обусловлено влиянием включенного фактора Х3 (общая площадь квартиры). Значимость модели (F=6,62395E-12) улучшилась, по сравнению с первой и второй моделью. Вычисляем табличное значение t-критерия Стьюдента=2,028 (при вероятности=0,05) и сравниваем с табличными значениями t-статистика=9,76>2,028 - tтабл., фактор Х3 – значим.
В нашей задаче β3=1,5426 (коэффициент при Х3) показывает, что при увеличении общей площади квартиры на 1 м2, цена квартиры увеличится на 1,5426 тыс. долл. α = -13,11 - постоянная величина отрицательная и экономической значимости не имеет, так как при общей площади квартиры равной нулю, цена квартиры тоже равной нулю.
Качество модели осталось прежним, модель уравнения парной регрессии со значимым фактором не изменилась.
Ответ: Качество модели Y = -13,11+ 1,54*Х3 осталось прежним, так как модель уравнения парной регрессии со значимым фактором не изменилась и осталась однофакторной со значимым фактором Х3 (общая площадь квартиры).
Регрессионная статистика | ||
Множественный R |
Коэффициент множественной корреляции, индекс корреляции |
0,8455513 |
R-квадрат |
Коэффициент детерминации, R2 |
0,714957 |
F |
Критерий Фишера |
95,3132216> Fтабл.= 4,098172 |
отнж |
Средняя относительная ошибка аппроксимации |
28% |
Оценка влияния отдельных факторов на зависимую переменную на основе модели Y = -13,11+ 1,54Х3.
Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов (Х) на зависимую переменную(Y) из-за различия единиц измерения, используем коэффициент эластичности (Э), b-коэффициент и D-коэффициент, которые соответственно рассчитываются по формулам:
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент. Высокий уровень эластичности означает сильное влияние независимой переменной на объясняемую переменную.
аj=1,543 - берем из уравнения регрессии коэффициент при Х3
Считаем в Excel среднее значение Х3: функция – СРЗНАЧ, выделяем значения в столбце Х3
= 69,2075
Аналогично считаем среднее значение Y: функция – СРЗНАЧ, выделяем значения в столбце Y
= 93,65025
1,543´69,2075/93,65025=1,14
Эластичность не нормирована и может изменяться от - ∞ до + ∞.
Э.=1,14 означает, что если среднее значение общей площади квартиры =69,2075, изменится на 1%, это приведет к изменению =93,65025 среднего значения цены квартиры на 1,14%