Автор работы: Пользователь скрыл имя, 11 Марта 2013 в 11:05, контрольная работа
Задание по эконометрическому моделированию стоимости квартир в Московской области:
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х.
Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.
1.Задача 1. Эконометрическое моделирование стоимости квартир в Московской области…………………………..……………......
3
2.Задача 2 Исследовать динамику экономического показателя на основе анализа одномерного временного ряда……………….
Для всех трех уравнений β>0, переменные Хi (общая площадь квартиры, этаж квартиры и площадь кухни) и yi (цена квартиры) положительно коррелированны и имеют прямую связь.
Решение:
Для проведения регрессионного анализа с использованием надстройки Excel:
Основная задача регрессионного анализа заключается в исследовании зависимости изучаемой переменной от различных факторов и отображении их взаимосвязи в форме регрессионной модели.
Линейное уравнение связи двух переменных (парную регрессию) представим в виде:
уi=α+β*хi+εi
где α – постоянная величина (или свободный член уравнения);
β – коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений.
εi – случайная составляющая отражает тот факт, что изменение уi будет неточно описываться изменением Х, поскольку присутствуют другие факторы, неучтённые в данной модели.
Систематическую часть можно представить в виде уравнения:
ŷi=α+β*хi
Коэффициент регрессии β характеризует изменение переменной уi при изменении значения хi на единицу. Если β>0, переменные хi и уi положительно коррелированны и имеют прямую связь, если β<0 – отрицательно коррелированны и имеют обратную связь.
Оценки наименьших квадратов:
Коэффициент регрессии β вычисляется по формуле:
При ≠ 0
Вычислим Коэффициент регрессии β для фактора Х3 используя Exсel:
или используем следующие формулы:
Таблица 7
Наименование показателя в отчёте Excel |
Принятые наименование |
Формула |
Множественный R |
Коэффициент множественной корреляции, индекс корреляции |
R= |
R – квадрат |
Коэффициент детерминации R2 |
R2=1- |
Нормированный R – квадрат |
Скорректированный R2 |
|
Стандартная ошибка |
Среднеквадратическое |
Se= |
Наблюдения |
Количество наблюдений n |
n |
Таблица 8
df – число степеней свободы |
SS – сумма квадратов |
MS – среднее значение |
F – критерий Фишера | |
Регрессия |
k=1 |
|
/k |
F= |
Остаток |
n-k-1=38 |
|
/(n-k-1) |
|
Итого |
n-1=39 |
|
Ответ:
Лучшая модель парной регрессии фактора Х3; y3=-11,7088+1,5426*Х3. Поскольку только для этой модели Fрасч > Fтабл, уравнение регрессии следует признать адекватным. Коэффициент детерминации (R2=0,592395) высокий, близкий к 1, хорошее качество модели. 59% вариации зависимой переменной Y учтено в модели и обусловлено влиянием включенного фактора Х3 (общая площадь квартиры).
В нашей задаче β3=1,5426 (коэффициент при Х3) показывает, что при увеличении общей площади квартиры на 1 м2, цена квартиры увеличится на 1,5426 тыс. долл.
Критерии |
Первая модель Для Х3 |
Вторая модель Для Х5 |
Третья модель Для Х6 |
Выводы |
R2-коэффициент детерминации |
0.592395 |
0.021428 |
0.076881 |
Модель Х3 лучше |
- средняя ошибка аппроксимации |
28% |
46 % |
49 % |
Модель Х3 лучше |
F-критерий Фишера |
95,3132216 |
0,832088977 |
3,164784713 |
Fтабл.= 4,098172 Модель Х3 адекватна, остальные нет |
Решение:
4.1 Оценим качество моделей через коэффициенты детерминации R2 для всех факторов (Х).
Коэффициент детерминации R2 рассчитывается по формуле:
y3=-11,7088+1,5426*Х3 R
Коэффициент детерминации высокий, близкий к 1, хорошее качество модели.
Коэффициент детерминации показывает, что около 71% вариации зависимой переменной Y учтено в модели и обусловлено влиянием на него включённых факторов.
y5=81,74288+1,8876*Х5
Коэффициент детерминации очень низкий, близкий к 0, фактор почти не влияет на Y (стоимость квартиры).
y6=34,77295+5,9947*Х6
Коэффициент детерминации очень низкий, близкий к 0, фактор почти не влияет на Y (стоимость квартиры).
Средняя относительная ошибка аппроксимации вычисляется по формуле:
Подставляя в уравнения регрессии фактические значения факторов Хi, найдем ŷi
Вычисляем остаток ei , который представляет собой отклонение фактического значения зависимой переменной от ее значения, полученного расчетным путем.
ei= yi − ŷi
Или берем остатки ei из протокола регрессионного анализа (для первой модели Таблица 4, для второй Таблица 5, для третьей модели Таблица 6)
Рассчитаем Ei по формуле:
Для того чтобы получить значение ei/yi по модулю │ei/yi│*100 необходимо воспользоваться функцией Exсel – функция -ABS (выделяем значение e1, / на y1*100), а затем суммировать столбец и разделить на n.
= 27,87 = 28 %
= 45,78= 46 %
= 48,63 = 49%.
< 7% свидетельствует о хорошем качестве модели. Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации.
Наиболее удачная модель для фактора Х3; y3=-11,7088+1,5426*Х3
F= ,
n- количетво наблюдений.= 40
k – количество факторов, включенных в модель = 1
α – уровнень значимости = 0,05
Табличное значение F-критерия можно найти EXCEL: Fтабл.= 4,098172
4.3.1
F-критерий Фишера для фактора Х3 можем взять из протокола регрессионного анализа Excel (F) для фактора Х3
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
1 |
73931,13794 |
73931,13794 |
95,31322 |
4.3.2
Также F-критерий Фишера для фактора Х5 можем взять из протокола регрессионного анализа Excel (F) для фактора Х5 .
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
1 |
2215,779194 |
2215,779194 |
0,832088977 |
4.3.3
Также F-критерий Фишера для фактора Х6 можем взять из протокола регрессионного анализа Excel (F) для фактора Х6 .
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
1 |
7949,975478 |
7949,975478 |
3,164784713 |
Fyx3 =95,3132216 > Fтабл.= 4,098172
Fyx5=0,832088977< Fтабл.= 4,098172
Fyx6=3,164784713 < Fтабл.= 4,098172
Поскольку только для модели фактора Х3; y3=-11,7088+1,5426*Х3 Fрасч > Fтабл, уравнение регрессии следует признать адекватным.
Ответ:
Прогнозное значение для модели yх3i=-11,7088+1,5426*Х3i
= 196,07 с вероятностью 80% будет
находиться между верхней
Фактические и модельные значения точки прогноза представлены на Графике 9 (изображены треугольниками, черный треугольник – модельное значение, белые треугольники – фактическое значение точки прогноза, черный ромб – среднее значение Yсред=93,65, Хсред=69,21).
Координаты точки прогноза модельной: Yпрогн=196,07, Хпрогн=135,6;
Координаты точки прогноза фактические:
верхний предел: Yпрогн=246,79, Хпрогн=135,6;
нижний предел: Yпрогн=145,35, Хпрогн=135,6
Решение: Прогнозирование по регрессионной модели: прогнозируемое значение переменной Y получается при подстановке в уравнение регрессии прогнозируемой величины фактора Хпрогн..
Определяем Хпрогн. : выбираем самое большое значение Х3max с помощью Excel:
Зная Х3max можно рассчитать Х прогн.:
Х3max=169,5
Хпрогн. = 169,5*80% /100=169,5*0,8=135,6 м2
Yсред=95,05 тыс. долл.
Для того, чтобы определить цену квартиры при общей площади квартиры 135,6 м2, необходимо подставить значение Хпрогн в полученную модель: