Автор работы: Пользователь скрыл имя, 05 Сентября 2013 в 15:55, контрольная работа
Задание № 1. Эконометрическое моделирование стоимости квартир в Московской области.
Задача № 2. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
5. Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4 = 91 найдем с помощью функции МАКС. Тогда прогнозное значение Х4* = 72,8. Рассчитаем по уравнению модели (3) прогнозное значение Y:
Y*Т = – 2,86 + 2,48* Х4* = – 2,86 + 2,48 * 72,8 = 177,39.
Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая цена квартиры будет составлять около 177,39 тыс. долл.
Зададим доверительную вероятность p = 1 – α = 1– 0,1 = 0,9 и построим доверительный прогнозный интервал для среднего значения Y.
Для этого нужно рассчитать стандартную ошибку прогнозирования для среднего значения результирующего признака:
S(Y*Т)
= SE *
Предварительно подготовим:
- стандартная ошибка SE = 28,2 из таблицы «регрессионная статистика»
- по столбцу данных Х4 найдем среднее значение = 42,04 с помощью функции СРЗНАЧ и определим = 15950,82 с помощью функции КВАДРОТКЛ;
- tкр – коэффициент Стьюдента для уровня значимости α=10% и числа степеней свободы k = 38. tкр = 1,686 с помощью функции СТЬЮДРАСПОБР.
Следовательно, стандартная ошибка прогнозирования для среднего значения составляет:
S(Y*Т)
= 28,2 *
Размах доверительного интервала для среднего значения:
U(Y*Т) = tкр * S(Y*Т) = 1,686 * 8,188 = 13,805.
Границами прогнозного интервала будут:
Uнижн = Y*Т – U(Y*Т) = 177,39 – 13,805 = 163,58;
Uверх = Y*Т + U(Y*Т) = 177,39 + 13,805 = 191,19.
Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 163,58 тыс. долл. до 191,19 тыс. долл.
Для построения чертежа воспользуемся Мастером диаграмм (точечная) – покажем исходные данные (поле корреляции). Затем с помощью опции добавить линию тренда, построим линию модели и покажем на графике результаты прогнозирования.
6. Методом включения построим двух факторные модели, сохраняя в них наиболее информативный фактор – жилую площадь квартиры (Х4).
В качестве «входного интервала Х» укажем значения факторов Х1 и Х4, с помощью функции РЕГРЕССИЯ получим:
ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R |
0,875979 |
R-квадрат |
0,767339 |
Нормированный R-квадрат |
0,754763 |
Стандартная ошибка |
28,3714 |
Наблюдения |
40 |
Коэффициенты | |
Y-пересечение |
-6,4361 |
Х1 |
6,692936 |
Х4 |
2,48928 |
Таким образом, модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4 построена, ее уравнение имеет вид: YТ = –6,44 + 6,69*X1 + 2,49*Х4.
Используем в качестве «входного интервала Х» значения факторов Х2 и Х4, с помощью функции РЕГРЕССИИ найдем:
ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R |
0,874163 |
R-квадрат |
0,76416 |
Нормированный R-квадрат |
0,751412 |
Стандартная ошибка |
28,56458 |
Наблюдения |
40 |
Коэффициенты | |
Y-пересечение |
-2,16757 |
Х2 |
-1,57033 |
Х4 |
2,556497 |
Таким образом, модель (5) зависимости цены квартиры Y от числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:
YТ = –2,17 – 1,57*X2 + 2,56*Х4.
Построим множественную модель регрессии, учитывая все факторы (Х1, Х2, и Х4):
ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R |
0,876218 |
R-квадрат |
0,767758 |
Нормированный R-квадрат |
0,748404 |
Стандартная ошибка |
28,73688 |
Наблюдения |
40 |
Коэффициенты | |
Y-пересечение |
-5,64357 |
Х1 |
6,859631 |
Х2 |
-1,98516 |
Х4 |
2,591406 |
Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от города области Х1, числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:
YТ = –5,67 + 6,86*Х1 – 1,99*X2 + 2,59*Х4.
Выберем
лучшую из построенных. Для сравнения
моделей с различным
Модель |
Нормированный R-квадрат |
YТ = –6,44 + 6,69*X1 + 2,49*Х4 (4) |
0,754763 |
YТ = –2,17 – 1,57*X2 + 2,56*Х4 (5) |
0,751412 |
YТ = –5,67 + 6,86*Х1 – 1,99*X2 + 2,59*Х4 (6) |
0,748404 |
Таким образом, лучшей является модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4:
YТ = –6,44 + 6,69*X1 + 2,49*Х4.
Коэффициент регрессии b1 = 6,69, следовательно, при покупке квартиры в Люберцах (Х1) той же жилой площади (Х4), что и в Подольске цена квартиры (Y) увеличится в среднем на 6,69 тыс. долл.
Коэффициент регрессии b2 = 2,49, следовательно, при увеличении жилой площади (Х4) на 1 кв. м в одном городе (Х1), цена квартиры (Y) увеличится в среднем на 2,48 тыс. долл. Свободный коэффициент не имеет экономического смысла.
7. Оценим качество модели. Для оценки качества выбранной множественной модели (4) YТ = –6,44 + 6,69*X1 + 2,49*Х4 используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F – критерий Фишера.
Коэффициент детерминации R-квадрат выпишем из таблица «Регрессионная статистика» для модели (4).
R2 = 0,767, следовательно, вариация цены квартиры Y на 76,7% объясняется по данному уравнению вариацией города области Х1 и жилой площади Х4.
Используем исходные данные Yi и найденные остатки Еi из таблицы «Вывод остатка» для модели (4). Рассчитаем относительные погрешности и найдем среднее значение отн.
ВЫВОД ОСТАТКА |
|||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
1 |
47,55316 |
-9,55316 |
25,13988493 |
2 |
89,87092 |
-27,6709 |
44,48700502 |
3 |
95,62438 |
29,37562 |
23,50049523 |
4 |
86,88378 |
-25,7838 |
42,19931434 |
5 |
40,11344 |
26,88656 |
40,12920021 |
6 |
62,51696 |
30,48304 |
32,77746634 |
7 |
147,1244 |
-29,1244 |
24,68165955 |
8 |
103,0922 |
28,90778 |
21,89983249 |
9 |
132,9636 |
-40,4636 |
43,74441266 |
10 |
117,253 |
-12,253 |
11,66952159 |
11 |
45,06388 |
-3,06388 |
7,294943394 |
12 |
109,7852 |
15,21484 |
12,17187399 |
13 |
132,9636 |
37,03642 |
21,7861284 |
14 |
33,39238 |
4,60762 |
12,12531651 |
15 |
157,8564 |
-27,3564 |
20,96274499 |
16 |
78,19942 |
6,800579 |
8,000681624 |
17 |
100,6029 |
-2,60294 |
2,656062313 |
18 |
140,9293 |
-12,9293 |
10,10099834 |
19 |
118,0279 |
-33,0279 |
38,85635461 |
20 |
104,8066 |
55,1934 |
34,49587661 |
21 |
43,3495 |
16,6505 |
27,75083346 |
22 |
35,10676 |
5,893244 |
14,37376579 |
23 |
117,253 |
-27,253 |
30,28110852 |
24 |
116,7833 |
-33,7833 |
40,70272457 |
25 |
40,61129 |
4,388708 |
9,752684736 |
26 |
38,37094 |
0,62906 |
1,612974811 |
27 |
139,6846 |
-52,7846 |
60,7418157 |
28 |
48,32806 |
-8,32806 |
20,82015006 |
29 |
93,1351 |
-13,1351 |
16,41887615 |
30 |
220,0884 |
6,911617 |
3,044764999 |
31 |
217,5991 |
17,4009 |
7,40463685 |
32 |
37,59604 |
2,403964 |
6,009909809 |
33 |
46,30852 |
20,69148 |
30,88281157 |
34 |
137,1672 |
-14,1672 |
11,51807973 |
35 |
85,66726 |
14,33274 |
14,33273923 |
36 |
119,7423 |
-14,7423 |
14,04026449 |
37 |
86,88378 |
-16,5838 |
23,59001573 |
38 |
119,7423 |
-37,7423 |
46,02716795 |
39 |
211,8456 |
68,15436 |
24,34084302 |
40 |
149,6136 |
50,38636 |
25,19318084 |
По столбцу относительных погрешностей с помощью функции СРЗНАЧ найдем среднее значение отн = 22,69%.
Сравнение показывает, что 22,69% > 15%. Следовательно, точность модели неудовлетворительная.
С помощью F – критерия Фишера проверим значимость модели в целом. Для этого возьмем данные из таблицы «дисперсионный анализ» для модели (4)) F = 61,01.
Дисперсионный анализ |
|||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
98226,35 |
49113,17573 |
61,01499 |
1,92E-12 |
Остаток |
37 |
29782,64 |
804,9362779 |
||
Итого |
39 |
128009 |
С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37.
F = 61,01 > Fкр = 3,25, следовательно, уравнения модели (4) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (4) факторными переменными Х1 и Х4.
Дополнительно с помощью t – критерия Стьюдента проверим значимость отдельных коэффициентов модели.
Для выбранной модели (4) получены следующие значения:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
-6,4361 |
11,51649 |
-0,558859663 |
0,579624 |
Х1 |
6,692936 |
9,045869 |
0,739888746 |
0,464037 |
Х4 |
2,48928 |
0,22536 |
11,04580516 |
2,85E-13 |
Критическое значение tкр найдено для уровня значимости α = 5% и числа степеней свободы k = 40 – 2 – 1 = 37. tкр = 2,03.
Для свободного коэффициента a= –6,44 определена статистика
t(a) = – 0,56. |t(a)| = 0,56 < tкр = 2,03, следовательно, свободный коэффициент a = –6,44 не является значимым, его можно исключить из модели.
Для коэффициента регрессии b1 = 6,69 определена статистика t(b1)= 0,74.
|t(b1)| = 0,74 < tкр = 2,03, следовательно, коэффициента регрессии b1 не является значимым, его и фактор города области можно исключить из модели.
Для коэффициента регрессии b2=2,49 определена статистика t(b2)= 11,05.
|t(b2)| = 11,05 > tкр = 2,03, следовательно, коэффициента регрессии b2 является значимым, его и фактор жилой площади квартиры нужно сохранить в модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости α = 5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент a можно считать значимым на уровне 0,58 = 58%; коэффициент регрессии b1 – на уровне 0,46 = 46%;, а коэффициент регрессии b2 – на уровне 2,85E-13 = 0,000000000000285 = 0,000000000001%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (4) используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
YТ = – 2,86 + 2,48*X4 |
0,757684 |
YТ = –6,44 + 6,69*X1 + 2,49*Х4 (4) |
0,754763 |
Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 качество модели ухудшилось, что говорит не в пользу сохранения фактора Х1 в модели.
Средние коэффициенты эластичности в случае линейной модели определяются формулами Эj = bj * .
С помощью функции СРЗНАЧ найдем: = 0,45, = 42,045, = 101,24. Тогда Э1 = 6,69 * = 0,03, Э2 = 2,49 * = 1,03 .
Следовательно, при покупке квартиры в Люберцах (Х1) и неизменной жилой площади цена квартиры увеличится в среднем на 0,03%.
Увеличение жилой площади Х4 в том же городе на 1% приводит к увеличению цены квартиры в среднем на 1,03%.
Бета - коэффициенты определяются формулами βj = bj * .
С помощью функции СТАНДОТКЛОН найдем SX1 = 0,5; SX4 = 20,22; SY = 57,29. Тогда
β1 = 6,69 * = 0,06; β2 = 2,49 * = 0,88.
Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,06 своего стандартного отклонения SY, а при увеличении только фактора Х4 на одно его стандартное отклонение – увеличивается на 0,88 SY.