Автор работы: Пользователь скрыл имя, 11 Марта 2013 в 11:05, контрольная работа
Задание по эконометрическому моделированию стоимости квартир в Московской области:
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х.
Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.
1.Задача 1. Эконометрическое моделирование стоимости квартир в Московской области…………………………..……………......
3
2.Задача 2 Исследовать динамику экономического показателя на основе анализа одномерного временного ряда……………….
Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных
аj=1,543 - берем из уравнения регрессии коэффициент при Х3
Стандартные отклонения вычисляются по формулам:
Sx2= , Sy2=
Или находятся с помощью надстройки Excel:
Sx2 = Функция – СДАНДОТКЛОН – выделяется значения столбика Х3
Sy2 =Функция – СДАНДОТКЛОН – выделяется значения столбика Y
Sx2=28,226
Sy2=51,492
1,543 ´28,226/51,492=0,846
Или берем в Таблице 11 построенной при помощи программы SPSS:
Таблица 11
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
t |
Знч. | ||
B |
Стд. ошибка |
Бета |
||||
1 |
(Константа) |
-13,109 |
11,789 |
-1,112 |
,273 | |
X3 |
1,543 |
,158 |
,846 |
9,763 |
,000 |
a Зависимая переменная: Y
Это означает, что при увеличении общей площади квартиры в нашем примере на 28,23 м2 , цена квартиры увеличится на 43,56 тыс. долл. (0,846*51,492).
7.3 Эластичность и бета-коэфициенты позволяют упорядочить факторы Х по степени их влияния на зависимую переменную Y, долю влияния каждого фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэфициента по формуле:
Вычисляем ryx3 при помощи надстройки Excel:
Сервис-анализ данных – корреляция – выделяем столбцы Y и всех Х с надписями- метки – ОК
ryx3 = 0,845551302214632
1,543 ´28,226/51,492=0,846
R2 берем из протокола регрессионного анализа (Таблица 4)
Или рассчитываем по формуле:
R2 = 0,714957004676861
= 0,846*0,846/0,715=1
Построим уравнения регрессии с помощью надстройки Excel:
Таблица 12
Y1 |
X31 |
Y2 |
X32 | |
65 |
32 |
135 |
72 | |
56 |
32,2 |
100 |
73,4 | |
80 |
35,5 |
60,65 |
74 | |
39,6 |
36 |
95,5 |
80 | |
42,1 |
40,3 |
85 |
82,8 | |
39,5 |
42 |
92 |
83 | |
46 |
44 |
69,6 |
83 | |
81 |
45,5 |
184,6 |
83,9 | |
55,2 |
48 |
130 |
87 | |
78,9 |
49,3 |
152,3 |
89 | |
125 |
54 |
100 |
93,8 | |
57 |
55,1 |
157 |
98 | |
64,5 |
58,1 |
123,5 |
107,5 | |
61 |
58,1 |
250 |
152 | |
115 |
60 |
265 |
169,5 |
Y1= 11,77+ 1,2*Х31
Y2= -38,98+ 1,81Х32
Определим остаточную сумму квадратов для первой и второй регрессии по формуле:
S1ŷ= , S2ŷ=
Или возьмем значения из протокола регрессионного анализа (Таблицы 13,14)
Таблица 13
Дисперсионный анализ для первой подвыборки | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
1876,984 |
1876,984 |
3,3554 |
0,089988163 |
Остаток |
13 |
7 272,094 |
559,3918 |
||
Итого |
14 |
9149,077 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% | |
Y-пересечение |
11,77082 |
30,79139 |
0,382276 |
0,708433 |
-54,74994579 |
X3 |
1,20162 |
0,655986 |
1,831775 |
0,089988 |
-0,215552836 |
Таблица 14
Дисперсионный анализ для второй подвыборки | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
36933,74 |
36933,73501 |
32,6289049 |
7,14626E-05 |
Остаток |
13 |
14 715,13 |
1131,933025 |
||
Итого |
14 |
51648,86 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% | |
Y-пересечение |
-38,9791 |
31,3934 |
-1,241634014 |
0,236307542 |
-106,800435 |
X3 |
1,80897 |
0,316687 |
5,712171645 |
7,14626E-05 |
1,1248093 |
S1ŷ = 7272,09376320821;
S2ŷ = 14715,13
Вычислим отношение
Табличное значение F-критерия можно найти EXCEL: Fтабл.= 2,58
где n1 – количество наблюдений в первой подвыборке=15
k – количество оцениваемых параметров в уравнении регрессии = 1
где n – количество наблюдений в исходных данных=30
n1 – количество наблюдений в первой подвыборке=15
k – количество оцениваемых параметров в уравнении регрессии = 1
Fтабл.= 2,58 > Fрасч.=2,02
Вывод: гомоскедастичность имеет место, остатки распределены равномерно.
Рассчитаем по формуле, используя надстройку Excel:
dw= = =2,066
где ei= yi − ŷi
или берем значение критерия Дарбина-Уотсона из протокола регрессионного анализа для фактора Х3, рассчитанного в программе SPSS:
Дурбин-Уотсон |
2,066 |
d1=1,44, d2=1,54 < dw=2,066>2
Преобразовываем критерий по формуле dw' =4 – dw = 4-2,066 = 1,934
d2< dw' =1,934 <2 нулевая гипотеза принимается, автокорреляция отсутствует.
Задача 2 Исследовать динамику экономического показателя на основе анализа одномерного временного ряда.
В течение девяти последовательных недель фиксировался спрос Y(t) (млн. р.) на кредитные ресурсы финансовой компании. Временной ряд Y(t) этого показателя:
Номер варианта |
Номер наблюдения ( t = 1,2,…,9) | ||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 | |
5 |
6.4 |
8.4 |
11.4 |
13.4 |
16.4 |
19.4 |
21.4 |
24.4 |
27.4 |
Требуется:
1) Проверить наличие аномальных наблюдений.
2) Построить линейную модель , параметры которой оценить МНК ( - расчетные, смоделированные значения временного ряда).
3) Оценить адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7—3,7).
4) Оценить точность моделей на основе использования средней относительной ошибки аппроксимации.
5) Осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности р = 70%).
6) Фактические значения показателя, результаты моделирования и прогнозирования представить графически.
Вычисления провести с тремя знаками в дробной части. Основные промежуточные результаты вычислений представить в таблицах (при использовании компьютера представить соответствующие листинги с комментариями).
Решение:
1. Проверить наличие аномальных наблюдений.
Выявление аномальных наблюдений является обязательной процедурой этапа предварительного анализа данных, так как наличие аномальных наблюдений приводит к искажению результатов моделирования. Для диагностики аномальных наблюдений разработаны различные критерии, например, метод Ирвина.
Для всех или только для подозреваемых в аномальности наблюдений вычисляется величина :
, где
Вычисляем λрасч. для каждого наблюдения
t |
Y(t) |
λрасч |
(yt - )2 |
Расчетные значения |
Числовое выражение |
1 |
6.4 |
− |
102,232 |
= |
16,511 |
2 |
8.4 |
0,278 |
65,788 |
∑(yt - )2= |
416,886 |
3 |
11.4 |
0,415 |
26,122 |
Sy= |
7,219 |
4 |
13.4 |
0,278 |
9,678 |
||
5 |
16.4 |
0,415 |
0,012 |
||
6 |
19.4 |
0,415 |
8,346 |
||
7 |
21.4 |
0,278 |
23,902 |
||
8 |
24.4 |
0,415 |
62,236 |
||
9 |
27.4 |
0,415 |
118,570 |
||
16.511 |
∑(yt - )2 |
416,886 |