Автор работы: Пользователь скрыл имя, 11 Марта 2013 в 11:05, контрольная работа
Задание по эконометрическому моделированию стоимости квартир в Московской области:
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитайте параметры линейной парной регрессии для каждого фактора Х.
Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.
1.Задача 1. Эконометрическое моделирование стоимости квартир в Московской области…………………………..……………......
3
2.Задача 2 Исследовать динамику экономического показателя на основе анализа одномерного временного ряда……………….
Теперь получив расчетное значение критерия Ирвина λрасч., сравним его с табличным значением и сделаем выводы: при уровне значимости Р=0,95, числе наблюдений n = 9, λ меньше 1,5 ,следовательно, аномальные наблюдения отсутствуют.
2. Построить линейную модель , параметры которой оценить МНК ( - расчетные, смоделированные значения временного ряда).
Модель можно рассчитать по формуле:
где и – среднее значения, соответственно, моментов наблюдения и уровней ряда.
Также линейную модель можно построить с помощью программы Excel:
Вывод итогов Excel:
Регрессионная статистика |
|||||
Множественный R |
0,999013373 | ||||
R-квадрат |
0,998027719 | ||||
Нормированный R-квадрат |
0,997745964 | ||||
Стандартная ошибка |
0,342724842 | ||||
Наблюдения |
9 | ||||
Дисперсионный анализ |
|||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
416,0666667 |
416,0666667 |
3542,189189 |
9,92331E-11 |
Остаток |
7 |
0,822222222 |
0,117460317 |
||
Итого |
8 |
416,8888889 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | ||
Y-пересечение (а0) |
3,354444444 |
0,248983825 |
13,43237633 |
2,9734Е-06 | |
t-номер наблюдения (а1) |
2,633333333 |
0,044245587 |
59,51629348 |
9,92331E-11 |
ВЫВОД ОСТАТКА |
||
Наблюдение |
Предсказанное
Y(t) |
Остатки |
1 |
5,977777778 |
0,422222222 |
2 |
8,611111111 |
-0,211111111 |
3 |
11,24444444 |
0,155555556 |
4 |
13,87777778 |
-0,477777778 |
5 |
16,51111111 |
-0,111111111 |
6 |
19,14444444 |
0,255555556 |
7 |
21,77777778 |
-0,377777778 |
8 |
24,41111111 |
-0,011111111 |
9 |
27,04444444 |
0,355555556 |
После проведенного анализа уравнение будет иметь следующий вид
Y = 3,35+ 2,63*t
В нашей задаче а1=2,63 (коэффициент при t) показывает, что спрос каждую неделю увеличивается на 2 млн. 63 тыс. руб.
3. Оценить адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7—3,7)
Ответ:
Проверяемое свойство |
Используемые статистики |
Граница, табл. |
Вывод | ||
наименование |
Значение расчет. |
нижняя |
верхняя | ||
Множественный R, значимость |
Коэффициент множественной корреляции, индекс корреляции |
0,9990 |
-1 |
1 |
значима |
R-квадрат, значимость |
Коэффициент детерминации, R2 |
0,9980 |
значима | ||
Значимость по t-критерию Стьюдента |
t-статистика Стьюдента |
2,36 |
59,516293 |
значима | |
Значимость по F-критерию Фишера |
F |
3542,189 |
5,59 |
значима | |
Значимость |
Значимость F |
9,92330991877935E-11 |
значима | ||
Независимость |
dw-критерий |
0,85 |
1,08 |
1,36 |
адекватна |
Нормальность |
RS-критерий |
2,81 |
2,7 |
3,7 |
адекватна |
Случайность |
Критерий поворотных точек |
5>2 |
2 |
адекватна | |
Средняя относительная ошибка аппроксимации |
Еотн |
2,46 |
7 |
Точность линейной модели высокая | |
Вывод: модель статистики адекватна |
3.1 Проверка условия независимости случайных составляющих в различных наблюдениях. Зависимость текущих значений случайного члена от их непосредственно предшествующих значений называется автокорреляцией. Наличие (отсутствие) автокорреляции в отклонениях проверяют с помощью dw критерия Дарбина-Уотсона:
dw критерия Дарбина-Уотсона рассчитаем по формуле, используя надстройку Excel:
Остатки |
|
2 |
|
0,422222222 |
0,178271605 | ||
-0,211111111 |
-0,63333333 |
0,401111111 |
0,044567901 |
0,155555556 |
0,366666667 |
0,134444444 |
0,024197531 |
-0,477777778 |
-0,63333333 |
0,401111111 |
0,228271605 |
-0,111111111 |
0,366666667 |
0,134444444 |
0,012345679 |
0,255555556 |
0,366666667 |
0,134444444 |
0,065308642 |
-0,377777778 |
-0,63333333 |
0,401111111 |
0,142716049 |
-0,011111111 |
0,366666667 |
0,134444444 |
0,000123457 |
0,355555556 |
0,366666667 |
0,134444444 |
0,126419753 |
∑ |
1,875555556 |
0,822222222 |
2,28
Критические значения d-статистики для числа наблюдений n=9 и уровня значимости a=0,05 составляют: d1=0,82; d2=1,32. < dw=2,28 >2
Преобразовываем критерий по формуле dw' =4 – dw = 4-2,28 = 1,72
(d2=1,32)<(dw'=1,72)<2 нулевая гипотеза принимается, автокорреляция отсутствует.
3.2 Соответствие ряда остатков нормальному закону распределения определим при помощи R/S-критерия:
где - максимальный уровень ряда остатков, =0,42
- минимальный уровень ряда остатков, =-0,48;
- среднеквадратическое отклонение,
Критические границы R/S-критерия для числа наблюдений n=9 и уровня значимости a=0,05 имеют значения: (R/S)1=2,7 и (R/S)2=3,7.
Расчетное значение R/S-критерия попадает в
интервал между критическими границами
(R/S1=2,7)<(R/Sрасч=2,81)<(R/S
Таким образом, выполняются все пункты проверки адекватности модели. Это свидетельствует о том, что линейная модель вполне соответствует исследуемому экономическому процессу.
3.3 Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек, P > [2/3(n-2) – 1, 96 √ (16n-29)/90] их количество определим с помощью Графика остатков:
Количество поворотных точек p= 5.
где р – фактическое количество поворотных точек в случайном ряду, p=5;
1,96 – квантиль нормального
распределения для 5%-ного
Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов
≈2
Неравенство выполняется (5>2), следовательно, свойство случайности выполняется. Модель по этому критерию адекватна.
4. Оценить точность моделей на основе использования средней относительной ошибки аппроксимации.
Для вычисления
средней относительной ошибки аппроксимации
воспользуемся следующей
где
Расчет средней относительной ошибки аппроксимации в Excel:
Для того чтобы получить значение ei/yi по модулю │ei/yi│*100 необходимо воспользоваться функцией Exсel – функция -ABS (выделяем значение e1, / на y1*100), а затем суммировать столбец и разделить на n=9.
|
Y(t) |
|
0,422222222 |
6,4 |
6,597222 |
-0,211111111 |
8,4 |
2,513228 |
0,155555556 |
11,4 |
1,364522 |
-0,477777778 |
13,4 |
3,565506 |
-0,111111111 |
16,4 |
0,677507 |
0,255555556 |
19,4 |
1,317297 |
-0,377777778 |
21,4 |
1,765317 |
-0,011111111 |
24,4 |
0,045537 |
0,355555556 |
27,4 |
1,297648 |
∑ |
19,14378 | |
∑ / 9 |
2,127087 |
Еотн.= 2,127 <7 %
Значение Еотн показывает, что предсказанные моделью значения прибыли предприятия Y отличаются от фактических значений в среднем на 2,5%. Средняя относительная ошибка аппроксимации менее 7% свидетельствует о высокой точности линейной модели.
5. Осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности р = 70 %):
Для того, чтобы осуществить прогноз спроса на следующие две недели, необходимо рассчитать экстраполяцию на два шага вперед, которая получается путем подстановки в модель значений времени . Таким образом, экстраполяция на k шагов вперед имеет вид:
.
Соответственно, экстраполяция уравнения на две следующие недели (k1= 1 и k2 = 2) дает прогнозное значение спроса на кредитные ресурсы финансовой компании, равное:
t1 =n+k1 =9+1=10 и t2 = n+k2 =9+2=11,
Для построения интервального прогноза рассчитаем доверительный интервал, при уровне значимости равной α=0,3 и доверительной вероятности 70 %.
Ширину доверительного интервала рассчитаем по формуле:
,
где =√0,82/(9-1-1) = 0,343
m – количество факторов.
t-Критерий Стьюдента табличный (tα) вычислим с помощью программы Exсel: функция-СТЬЮДРАСПОБР(уровень значимости=0,3;степень свободы = n –2 = 9 - 2 = 7) следовательно tα = 1,119.
Ранее были рассчитаны параметры линейной регрессии при помощи инструмента Excel «Анализ данных» и был получен результат, в котором существует таблица «Регрессионная статистика», откуда можно использовать уже рассчитанное значение Se = 0,343.
Регрессионная статистика |
Формула |
Числовое значение |
Множественный R |
|
0,999013373 |
R-квадрат |
|
0,998027719 |
Нормированный R-квадрат |
|
0,997745964 |
Стандартная ошибка |
|
0,342724842 |
Наблюдения |
9 |
, где
t |
Y(t) |
|
|
1 |
6,4 |
-4 |
16 |
2 |
8,4 |
-3 |
9 |
3 |
11,4 |
-2 |
4 |
4 |
13,4 |
-1 |
1 |
5 |
16,4 |
0 |
0 |
6 |
19,4 |
1 |
1 |
7 |
21,4 |
2 |
4 |
8 |
24,4 |
3 |
9 |
9 |
27,4 |
4 |
16 |
∑ |
60 |