Автор работы: Пользователь скрыл имя, 21 Мая 2012 в 16:22, контрольная работа
Эконометрическое моделирование стоимости квартир в Московской области.
Рассчитать матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции
Задача 1 |
|||||||||
Эконометрическое
моделирование стоимости |
|||||||||
Исходные данные |
|||||||||
t |
Y |
X1 |
X2 |
X4 |
|||||
41 |
38 |
1 |
1 |
19 |
|||||
42 |
62,2 |
1 |
2 |
36 |
|||||
43 |
125 |
0 |
3 |
41 |
|||||
44 |
61,1 |
1 |
2 |
34,8 |
|||||
45 |
67 |
0 |
1 |
18,7 |
|||||
46 |
93 |
0 |
2 |
27,7 |
|||||
47 |
118 |
1 |
3 |
59 |
|||||
48 |
132 |
0 |
3 |
44 |
|||||
49 |
92,5 |
0 |
3 |
56 |
|||||
50 |
105 |
1 |
4 |
47 |
|||||
51 |
42 |
1 |
1 |
18 |
|||||
52 |
125 |
1 |
3 |
44 |
|||||
53 |
170 |
0 |
4 |
56 |
|||||
54 |
38 |
0 |
1 |
16 |
|||||
55 |
130,5 |
0 |
4 |
66 |
|||||
56 |
85 |
0 |
2 |
34 |
|||||
57 |
98 |
0 |
4 |
43 |
|||||
58 |
128 |
0 |
4 |
59,2 |
|||||
59 |
85 |
0 |
3 |
50 |
|||||
60 |
160 |
1 |
3 |
42 |
|||||
61 |
60 |
0 |
1 |
20 |
|||||
62 |
41 |
1 |
1 |
14 |
|||||
63 |
90 |
1 |
4 |
47 |
|||||
64 |
83 |
0 |
4 |
49,5 |
|||||
65 |
45 |
0 |
1 |
18,9 |
|||||
66 |
39 |
0 |
1 |
18 |
|||||
67 |
86,9 |
0 |
3 |
58,7 |
|||||
68 |
40 |
0 |
1 |
22 |
|||||
69 |
80 |
0 |
2 |
40 |
|||||
70 |
227 |
0 |
4 |
91 |
|||||
71 |
235 |
0 |
4 |
90 |
|||||
72 |
40 |
1 |
1 |
15 |
|||||
73 |
67 |
1 |
1 |
18,5 |
|||||
74 |
123 |
1 |
4 |
55 |
|||||
75 |
100 |
0 |
3 |
37 |
|||||
76 |
105 |
1 |
3 |
48 |
|||||
77 |
70,3 |
1 |
2 |
34,8 |
|||||
78 |
82 |
1 |
3 |
48 |
|||||
79 |
280 |
1 |
4 |
85 |
|||||
80 |
200 |
1 |
4 |
60 |
|||||
где, Y- цена квартиры, тыс.долларов; X1- город области (1-Подольск, 0-Люберцы); X2 - число комнат в квартире; X4 -жилая площадь квартиры, кв.м. | |||||||||
Решение: |
|||||||||
Задание 1 |
|||||||||
Рассчитать матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции |
|||||||||
1. Строим матрицу парных коэффициентов корреляции (сервис → анализ данных → корреляция→ОК). |
|||||||||
Y |
X1 |
X2 |
X4 |
||||||
Y |
1 |
||||||||
X1 |
-0,011 |
1 |
|||||||
X2 |
0,751 |
-0,034 |
1 |
||||||
X4 |
0,874 |
-0,080 |
0,869 |
1 |
|||||
2. Проводим оценку статистической зависимости коэффициентов корреляции по критерию Стьюдента: |
|||||||||
tr = √r² *(n-2) / (1-r²) |
|||||||||
где, n=40 - количество наблюдений |
|||||||||
Если I tr I > t табл, то фактор r значим |
|||||||||
t табл (α; n -2) =t табл (0.05; 40-2)= t табл (0.05;38) = 2,024 | |||||||||
r |
tr |
||||||||
-0,011 |
0,069 |
не значим |
связь между Y и Х1 практически отсутствует, обратная | ||||||
0,751 |
7,012 |
значим |
связь между Y и X2 тесная, прямая |
||||||
0,874 |
11,088 |
значим |
связь между Y и X4 тесная, прямая |
||||||
-0,034 |
0,210 |
не значим |
связь между Х1 и Х2 практически отсутствует, обратная | ||||||
-0,080 |
0,493 |
не значим |
связь между Х1 и Х4 практически отсутствует, обратная | ||||||
0,869 |
10,802 |
значим |
связь между Х2 и X4 тесная, прямая |
||||||
r (X2;Х4)=0,869>0,8 - факторы Х2 и Х4 коллинеарны, вместе в модель включать нельзя | |||||||||
В модель включаем фактор Х4, |
|||||||||
т.к. I ryx4 I > I ryx2 I |
|||||||||
I 0,874 I > I 0,751 I |
|||||||||
Yрасч(x4)=f (x4) - однофакторное уравнение парной регрессии |
|||||||||
Задание 2. Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора | |||||||||
t |
X4 |
Y |
|||||||
41 |
19 |
38 |
|||||||
42 |
36 |
62,2 |
|||||||
43 |
41 |
125 |
|||||||
44 |
34,8 |
61,1 |
|||||||
45 |
18,7 |
67 |
|||||||
46 |
27,7 |
93 |
|||||||
47 |
59 |
118 |
|||||||
48 |
44 |
132 |
|||||||
49 |
56 |
92,5 |
|||||||
50 |
47 |
105 |
|||||||
51 |
18 |
42 |
|||||||
52 |
44 |
125 |
|||||||
53 |
56 |
170 |
|||||||
54 |
16 |
38 |
|||||||
55 |
66 |
130,5 |
|||||||
56 |
34 |
85 |
|||||||
57 |
43 |
98 |
|||||||
58 |
59,2 |
128 |
|||||||
59 |
50 |
85 |
|||||||
60 |
42 |
160 |
|||||||
61 |
20 |
60 |
|||||||
62 |
14 |
41 |
|||||||
63 |
47 |
90 |
|||||||
64 |
49,5 |
83 |
|||||||
65 |
18,9 |
45 |
|||||||
66 |
18 |
39 |
|||||||
67 |
58,7 |
86,9 |
|||||||
68 |
22 |
40 |
|||||||
69 |
40 |
80 |
|||||||
70 |
91 |
227 |
|||||||
71 |
90 |
235 |
|||||||
72 |
15 |
40 |
|||||||
73 |
18,5 |
67 |
|||||||
74 |
55 |
123 |
|||||||
75 |
37 |
100 |
|||||||
76 |
48 |
105 |
|||||||
77 |
34,8 |
70,3 |
|||||||
78 |
48 |
82 |
|||||||
79 |
85 |
280 |
|||||||
80 |
60 |
200 |
|||||||
1. Строим поле корреляции по полученным данным (вставка → диаграмма→ точечная→далее) | |||||||||
|
|||||||||
Yрасч(Х4)= а0+а1*X4 - линейное уравнение парной регрессии |
|||||||||
Yрасч(Х4)= -2,865+2,476*X4- линейное уравнение парной регрессии |
|||||||||
а0 = -2,865 - коэффициент регрессии а1=2,476 - коэффициент регрессии, показывает на сколько в среднем изменяется значение результата Y, если фактор X4 увеличить на единицу измерения. Если X4(жилая площадь квартиры) увеличить на 1кв.м, то Y(цена квартиры) возрастет на 2,476 тыс.долл. R-квадрат = 0,764 - коэффициент
детерминации, показывает долю вариации
результативного признака т.е.76,4% изменения результата Y происходит под влиянием фактора Х4 | |||||||||
Задание 3.Рассчитать параметры линейной парной регрессии для всех факторов Х | |||||||||
t |
Y |
X1 |
X2 |
X4 |
|||||
41 |
38 |
1 |
1 |
19 |
|||||
42 |
62,2 |
1 |
2 |
36 |
|||||
43 |
125 |
0 |
3 |
41 |
|||||
44 |
61,1 |
1 |
2 |
34,8 |
|||||
45 |
67 |
0 |
1 |
18,7 |
|||||
46 |
93 |
0 |
2 |
27,7 |
|||||
47 |
118 |
1 |
3 |
59 |
|||||
48 |
132 |
0 |
3 |
44 |
|||||
49 |
92,5 |
0 |
3 |
56 |
|||||
50 |
105 |
1 |
4 |
47 |
|||||
51 |
42 |
1 |
1 |
18 |
|||||
52 |
125 |
1 |
3 |
44 |
|||||
53 |
170 |
0 |
4 |
56 |
|||||
54 |
38 |
0 |
1 |
16 |
|||||
55 |
130,5 |
0 |
4 |
66 |
|||||
56 |
85 |
0 |
2 |
34 |
|||||
57 |
98 |
0 |
4 |
43 |
|||||
58 |
128 |
0 |
4 |
59,2 |
|||||
59 |
85 |
0 |
3 |
50 |
|||||
60 |
160 |
1 |
3 |
42 |
|||||
61 |
60 |
0 |
1 |
20 |
|||||
62 |
41 |
1 |
1 |
14 |
|||||
63 |
90 |
1 |
4 |
47 |
|||||
64 |
83 |
0 |
4 |
49,5 |
|||||
65 |
45 |
0 |
1 |
18,9 |
|||||
66 |
39 |
0 |
1 |
18 |
|||||
67 |
86,9 |
0 |
3 |
58,7 |
|||||
68 |
40 |
0 |
1 |
22 |
|||||
69 |
80 |
0 |
2 |
40 |
|||||
70 |
227 |
0 |
4 |
91 |
|||||
71 |
235 |
0 |
4 |
90 |
|||||
72 |
40 |
1 |
1 |
15 |
|||||
73 |
67 |
1 |
1 |
18,5 |
|||||
74 |
123 |
1 |
4 |
55 |
|||||
75 |
100 |
0 |
3 |
37 |
|||||
76 |
105 |
1 |
3 |
48 |
|||||
77 |
70,3 |
1 |
2 |
34,8 |
|||||
78 |
82 |
1 |
3 |
48 |
|||||
79 |
280 |
1 |
4 |
85 |
|||||
80 |
200 |
1 |
4 |
60 |
|||||
Фактор Х1 |
|||||||||
Yрасч (Х1) = a0+a1*Х1 - линейное уравнение парной регрессии (сервис → анализ данных → регрессия). | |||||||||
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,011 |
R=√1-(∑(y(t)-yрасч(t))^2)/ (∑(y(t)-yср(t))^2) | |||||||
R-квадрат |
0,000 |
R^2= 1-(∑(y(t)-yрасч(t))^2)/ (∑(y(t)-yср(t))^2) | |||||||
Нормированный |
-0,026 |
R^2=1-(∑(y(t)-yрасч(t))^2)/(n- | |||||||
Стандартная |
58,036 |
S(y)=√ ∑(y(t)-yрасч(t))^2)/(n-m-1) |
|||||||
Наблюдения |
40 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
16,228 |
16,228 |
0,005 |
0,945 |
||||
Остаток |
38 |
127992,766 |
3368,231 |
||||||
Итого |
39 |
128008,994 |
|||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
101,814 |
12,373 |
8,228 |
0,000 |
76,765 |
126,862 |
|||
X1 |
-1,280 |
18,445 |
-0,069 |
0,945 |
-38,621 |
36,060 |
|||
ВЫВОД ОСТАТКА |
|||||||||
Наблюдение |
Предсказанное Y |
Остатки |
|||||||
1 |
100,533 |
-62,533 |
|||||||
2 |
100,533 |
-38,333 |
|||||||
3 |
101,814 |
23,186 |
|||||||
4 |
100,533 |
-39,433 |
|||||||
5 |
101,814 |
-34,814 |
|||||||
6 |
101,814 |
-8,814 |
|||||||
7 |
100,533 |
17,467 |
|||||||
8 |
101,814 |
30,186 |
|||||||
9 |
101,814 |
-9,314 |
|||||||
10 |
100,533 |
4,467 |
|||||||
11 |
100,533 |
-58,533 |
|||||||
12 |
100,533 |
24,467 |
|||||||
13 |
101,814 |
68,186 |
|||||||
14 |
101,814 |
-63,814 |
|||||||
15 |
101,814 |
28,686 |
|||||||
16 |
101,814 |
-16,814 |
|||||||
17 |
101,814 |
-3,814 |
|||||||
18 |
101,814 |
26,186 |
|||||||
19 |
101,814 |
-16,814 |
|||||||
20 |
100,533 |
59,467 |
|||||||
21 |
101,814 |
-41,814 |
|||||||
22 |
100,533 |
-59,533 |
|||||||
23 |
100,533 |
-10,533 |
|||||||
24 |
101,814 |
-18,814 |
|||||||
25 |
101,814 |
-56,814 |
|||||||
26 |
101,814 |
-62,814 |
|||||||
27 |
101,814 |
-14,914 |
|||||||
28 |
101,814 |
-61,814 |
|||||||
29 |
101,814 |
-21,814 |
|||||||
30 |
101,814 |
125,186 |
|||||||
31 |
101,814 |
133,186 |
|||||||
32 |
100,533 |
-60,533 |
|||||||
33 |
100,533 |
-33,533 |
|||||||
34 |
100,533 |
22,467 |
|||||||
35 |
101,814 |
-1,814 |
|||||||
36 |
100,533 |
4,467 |
|||||||
37 |
100,533 |
-30,233 |
|||||||
38 |
100,533 |
-18,533 |
|||||||
39 |
100,533 |
179,467 |
|||||||
40 |
100,533 |
99,467 |
|||||||
Yрасч = 101,814 - 1,28*Х1 -линейное уравнение парной регрессии |
|||||||||
Фактор Х2 | |||||||||
Yрасч (Х2) = a0+a2*Х2 - линейное уравнение парной регрессии (сервис → анализ данных → регрессия). | |||||||||
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,751 |
R=√1-(∑(y(t)-yрасч(t))^2)/ (∑(y(t)-yср(t))^2) | |||||||
R-квадрат |
0,564 |
R^2= 1-(∑(y(t)-yрасч(t))^2)/ (∑(y(t)-yср(t))^2) | |||||||
Нормированный |
0,553 |
R^2=1-(∑(y(t)-yрасч(t))^2)/(n- | |||||||
Стандартная |
38,320 |
S(y)=√ ∑(y(t)-yрасч(t))^2)/(n-m-1) | |||||||
Наблюдения |
40 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
72208,879 |
72208,879 |
49,174 |
2,36579E-08 |
||||
Остаток |
38 |
55800,114 |
1468,424 |
||||||
Итого |
39 |
128008,994 |
|||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
7,539 |
14,671 |
0,514 |
0,610 |
-22,161 |
37,240 |
|||
X2 |
36,038 |
5,139 |
7,012 |
0,000 |
25,634 |
46,441 |
|||
ВЫВОД ОСТАТКА |
|||||||||
Наблюдение |
Предсказанное Y |
Остатки |
|||||||
1 |
43,577 |
-5,577 |
|||||||
2 |
79,615 |
-17,415 |
|||||||
3 |
115,653 |
9,347 |
|||||||
4 |
79,615 |
-18,515 |
|||||||
5 |
43,577 |
23,423 |
|||||||
6 |
79,615 |
13,385 |
|||||||
7 |
115,653 |
2,347 |
|||||||
8 |
115,653 |
16,347 |
|||||||
9 |
115,653 |
-23,153 |
|||||||
10 |
151,690 |
-46,690 |
|||||||
11 |
43,577 |
-1,577 |
|||||||
12 |
115,653 |
9,347 |
|||||||
13 |
151,690 |
18,310 |
|||||||
14 |
43,577 |
-5,577 |
|||||||
15 |
151,690 |
-21,190 |
|||||||
16 |
79,615 |
5,385 |
|||||||
17 |
151,690 |
-53,690 |
|||||||
18 |
151,690 |
-23,690 |
|||||||
19 |
115,653 |
-30,653 |
|||||||
20 |
115,653 |
44,347 |
|||||||
21 |
43,577 |
16,423 |
|||||||
22 |
43,577 |
-2,577 |
|||||||
23 |
151,690 |
-61,690 |
|||||||
24 |
151,690 |
-68,690 |
|||||||
25 |
43,577 |
1,423 |
|||||||
26 |
43,577 |
-4,577 |
|||||||
27 |
115,653 |
-28,753 |
|||||||
28 |
43,577 |
-3,577 |
|||||||
29 |
79,615 |
0,385 |
|||||||
30 |
151,690 |
75,310 |
|||||||
31 |
151,690 |
83,310 |
|||||||
32 |
43,577 |
-3,577 |
|||||||
33 |
43,577 |
23,423 |
|||||||
34 |
151,690 |
-28,690 |
|||||||
35 |
115,653 |
-15,653 |
|||||||
36 |
115,653 |
-10,653 |
|||||||
37 |
79,615 |
-9,315 |
|||||||
38 |
115,653 |
-33,653 |
|||||||
39 |
151,690 |
128,310 |
|||||||
40 |
151,690 |
48,310 |
|||||||
Yрасч = 7,539 + 36,038*Х2 -линейное уравнение парной регрессии |
|||||||||
Фактор Х4 |
|||||||||
Yрасч (Х4) = a0+a4*Х4 - линейное уравнение парной регрессии (сервис → анализ данных → регрессия). | |||||||||
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,874 |
R=√1-(∑(y(t)-yрасч(t))^2)/ (∑(y(t)-yср(t))^2) | |||||||
R-квадрат |
0,764 |
R^2= 1-(∑(y(t)-yрасч(t))^2)/ (∑(y(t)-yср(t))^2) | |||||||
Нормированный |
0,758 |
R^2=1-(∑(y(t)-yрасч(t))^2)/(n- | |||||||
Стандартная |
28,202 |
S(y)=√ ∑(y(t)-yрасч(t))^2)/(n-m-1) | |||||||
Наблюдения |
40 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
97785,701 |
97785,701 |
122,947 |
1,792E-13 |
||||
Остаток |
38 |
30223,293 |
795,350 |
||||||
Итого |
39 |
128008,994 |
|||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
-2,865 |
10,394 |
-0,276 |
0,784 |
-23,906 |
18,176 |
|||
X4 |
2,476 |
0,223 |
11,088 |
0,000 |
2,024 |
2,928 |
|||
ВЫВОД ОСТАТКА |
|||||||||
Наблюдение |
Предсказанное Y |
Остатки |
|||||||
1 |
44,179 |
-6,179 |
|||||||
2 |
86,270 |
-24,070 |
|||||||
3 |
98,650 |
26,350 |
|||||||
4 |
83,299 |
-22,199 |
|||||||
5 |
43,436 |
23,564 |
|||||||
6 |
65,720 |
27,280 |
|||||||
7 |
143,218 |
-25,218 |
|||||||
8 |
106,078 |
25,922 |
|||||||
9 |
135,790 |
-43,290 |
|||||||
10 |
113,506 |
-8,506 |
|||||||
11 |
41,703 |
0,297 |
|||||||
12 |
106,078 |
18,922 |
|||||||
13 |
135,790 |
34,210 |
|||||||
14 |
36,751 |
1,249 |
|||||||
15 |
160,549 |
-30,049 |
|||||||
16 |
81,318 |
3,682 |
|||||||
17 |
103,602 |
-5,602 |
|||||||
18 |
143,713 |
-15,713 |
|||||||
19 |
120,934 |
-35,934 |
|||||||
20 |
101,126 |
58,874 |
|||||||
21 |
46,655 |
13,345 |
|||||||
22 |
31,799 |
9,201 |
|||||||
23 |
113,506 |
-23,506 |
|||||||
24 |
119,696 |
-36,696 |
|||||||
25 |
43,931 |
1,069 |
|||||||
26 |
41,703 |
-2,703 |
|||||||
27 |
142,475 |
-55,575 |
|||||||
28 |
51,607 |
-11,607 |
|||||||
29 |
96,174 |
-16,174 |
|||||||
30 |
222,449 |
4,551 |
|||||||
31 |
219,973 |
15,027 |
|||||||
32 |
34,275 |
5,725 |
|||||||
33 |
42,941 |
24,059 |
|||||||
34 |
133,314 |
-10,314 |
|||||||
35 |
88,746 |
11,254 |
|||||||
36 |
115,982 |
-10,982 |
|||||||
37 |
83,299 |
-12,999 |
|||||||
38 |
115,982 |
-33,982 |
|||||||
39 |
207,593 |
72,407 |
|||||||
40 |
145,694 |
54,306 |
|||||||
Yрасч = -2,865 + 2,476*Х4 -линейное уравнение парной регрессии |
|||||||||
Задание 4.Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимацию и F-критерий Фишера. Выберите лучшую модель | |||||||||
Фактор Х1 |
|||||||||
Yрасч = 101,814 - 1,28*Х1 -линейное уравнение парной регрессии |
|||||||||
t |
Y |
X1 |
Y*X1 |
||||||
41 |
38 |
1 |
38 |
||||||
42 |
62,2 |
1 |
62,2 |
||||||
43 |
125 |
0 |
0 |
||||||
44 |
61,1 |
1 |
61,1 |
||||||
45 |
67 |
0 |
0 |
||||||
46 |
93 |
0 |
0 |
||||||
47 |
118 |
1 |
118 |
||||||
48 |
132 |
0 |
0 |
||||||
49 |
92,5 |
0 |
0 |
||||||
50 |
105 |
1 |
105 |
||||||
51 |
42 |
1 |
42 |
||||||
52 |
125 |
1 |
125 |
||||||
53 |
170 |
0 |
0 |
||||||
54 |
38 |
0 |
0 |
||||||
55 |
130,5 |
0 |
0 |
||||||
56 |
85 |
0 |
0 |
||||||
57 |
98 |
0 |
0 |
||||||
58 |
128 |
0 |
0 |
||||||
59 |
85 |
0 |
0 |
||||||
60 |
160 |
1 |
160 |
||||||
61 |
60 |
0 |
0 |
||||||
62 |
41 |
1 |
41 |
||||||
63 |
90 |
1 |
90 |
||||||
64 |
83 |
0 |
0 |
||||||
65 |
45 |
0 |
0 |
||||||
66 |
39 |
0 |
0 |
||||||
67 |
86,9 |
0 |
0 |
||||||
68 |
40 |
0 |
0 |
||||||
69 |
80 |
0 |
0 |
||||||
70 |
227 |
0 |
0 |
||||||
71 |
235 |
0 |
0 |
||||||
72 |
40 |
1 |
40 |
||||||
73 |
67 |
1 |
67 |
||||||
74 |
123 |
1 |
123 |
||||||
75 |
100 |
0 |
0 |
||||||
76 |
105 |
1 |
105 |
||||||
77 |
70,3 |
1 |
70,3 |
||||||
78 |
82 |
1 |
82 |
||||||
79 |
280 |
1 |
280 |
||||||
80 |
200 |
1 |
200 |
||||||
сумма |
4049,5 |
18 |
1809,6 |
||||||
среднее значение |
101,238 |
0,45 |
45,24 |
||||||
1. Анализируем тесноту связи между переменными Y и Х1 |
|||||||||
r yx = (yx - y*x)/(σx*σy) |
|||||||||
где, σx - среднее квадратичное отклонение переменной Х; | |||||||||
σy - среднее квадратичное отклонение переменной Y. |
|||||||||
|
|||||||||
Для их находжения выполняем следующие действия: |
|||||||||
вставка → fx → статистические → СТАНДОТКЛОН |
|||||||||
σx1 = |
0,504 |
||||||||
σy = |
57,291 |
||||||||
r yx = (45,24 - 101,238*0,45)/(0,504*57,291) = |
-0,011 |
||||||||
Ir yxI = 0,011 = связь между переменными очень слабая, практически нет. |
|||||||||
2. Находим коэффициент детерминации: |
|||||||||
r² yx =( 0,011)² = |
0,0001 |
т.е.0,01% изменения результата Y происходит под влиянием фактора Х1 | |||||||
3. Находим среднюю ошибку аппроксимации |
|||||||||
Eотн.ср.=1/n*∑ I Et/Yt I*100% |
|||||||||
Наблюдение |
Предска- |
Остатки Et |
Et /Yt |
IEt /YtI |
|||||
1 |
100,533 |
-62,533 |
-0,622 |
0,622 |
|||||
2 |
100,533 |
-38,333 |
-0,381 |
0,381 |
|||||
3 |
101,814 |
23,186 |
0,228 |
0,228 |
|||||
4 |
100,533 |
-39,433 |
-0,392 |
0,392 |
|||||
5 |
101,814 |
-34,814 |
-0,342 |
0,342 |
|||||
6 |
101,814 |
-8,814 |
-0,087 |
0,087 |
|||||
7 |
100,533 |
17,467 |
0,174 |
0,174 |
|||||
8 |
101,814 |
30,186 |
0,296 |
0,296 |
|||||
9 |
101,814 |
-9,314 |
-0,091 |
0,091 |
|||||
10 |
100,533 |
4,467 |
0,044 |
0,044 |
|||||
11 |
100,533 |
-58,533 |
-0,582 |
0,582 |
|||||
12 |
100,533 |
24,467 |
0,243 |
0,243 |
|||||
13 |
101,814 |
68,186 |
0,670 |
0,670 |
|||||
14 |
101,814 |
-63,814 |
-0,627 |
0,627 |
|||||
15 |
101,814 |
28,686 |
0,282 |
0,282 |
|||||
16 |
101,814 |
-16,814 |
-0,165 |
0,165 |
|||||
17 |
101,814 |
-3,814 |
-0,037 |
0,037 |
|||||
18 |
101,814 |
26,186 |
0,257 |
0,257 |
|||||
19 |
101,814 |
-16,814 |
-0,165 |
0,165 |
|||||
20 |
100,533 |
59,467 |
0,592 |
0,592 |
|||||
21 |
101,814 |
-41,814 |
-0,411 |
0,411 |
|||||
22 |
100,533 |
-59,533 |
-0,592 |
0,592 |
|||||
23 |
100,533 |
-10,533 |
-0,105 |
0,105 |
|||||
24 |
101,814 |
-18,814 |
-0,185 |
0,185 |
|||||
25 |
101,814 |
-56,814 |
-0,558 |
0,558 |
|||||
26 |
101,814 |
-62,814 |
-0,617 |
0,617 |
|||||
27 |
101,814 |
-14,914 |
-0,146 |
0,146 |
|||||
28 |
101,814 |
-61,814 |
-0,607 |
0,607 |
|||||
29 |
101,814 |
-21,814 |
-0,214 |
0,214 |
|||||
30 |
101,814 |
125,186 |
1,230 |
1,230 |
|||||
31 |
101,814 |
133,186 |
1,308 |
1,308 |
|||||
32 |
100,533 |
-60,533 |
-0,602 |
0,602 |
|||||
33 |
100,533 |
-33,533 |
-0,334 |
0,334 |
|||||
34 |
100,533 |
22,467 |
0,223 |
0,223 |
|||||
35 |
101,814 |
-1,814 |
-0,018 |
0,018 |
|||||
36 |
100,533 |
4,467 |
0,044 |
0,044 |
|||||
37 |
100,533 |
-30,233 |
-0,301 |
0,301 |
|||||
38 |
100,533 |
-18,533 |
-0,184 |
0,184 |
|||||
39 |
100,533 |
179,467 |
1,785 |
1,785 |
|||||
40 |
100,533 |
99,467 |
0,989 |
0,989 |
|||||
сумма |
16,732 |
||||||||
Eотн.ср.=1/40*16,732*100% = |
41,830 |
% |
|||||||
Так как Eотн.ср.> 7(10)%, то данная модель парной регрессии не является точной. |
|||||||||
4. Находим F-критерий Фишера |
|||||||||
Fрасч = 0,005 (из таблицы дисперсионный анализ) |
|||||||||
Находим Fтабл (α; к1;к2) , где: |
|||||||||
α = 0.05 - вероятность |
|||||||||
к1 = m = 1 - число факторов в модели |
|||||||||
к2 = n-m-1 = 40-1-1 = 38 |
|||||||||
Fтабл (0.05; 1; 38)= |
4,098 |
||||||||
Сравниваем Fрасч и Fтабл |
|||||||||
0,005 < 4.098 , следовательно уравнение регрессии не является значимым. |
|||||||||
Фактор Х2 |
|||||||||
Yрасч = 7,539 + 36,038*Х2 -линейное уравнение парной регрессии |
|||||||||
t |
Y |
X2 |
Y*Х2 |
||||||
41 |
38 |
1 |
38 |
||||||
42 |
62,2 |
2 |
124,4 |
||||||
43 |
125 |
3 |
375 |
||||||
44 |
61,1 |
2 |
122,2 |
||||||
45 |
67 |
1 |
67 |
||||||
46 |
93 |
2 |
186 |
||||||
47 |
118 |
3 |
354 |
||||||
48 |
132 |
3 |
396 |
||||||
49 |
92,5 |
3 |
277,5 |
||||||
50 |
105 |
4 |
420 |
||||||
51 |
42 |
1 |
42 |
||||||
52 |
125 |
3 |
375 |
||||||
53 |
170 |
4 |
680 |
||||||
54 |
38 |
1 |
38 |
||||||
55 |
130,5 |
4 |
522 |
||||||
56 |
85 |
2 |
170 |
||||||
57 |
98 |
4 |
392 |
||||||
58 |
128 |
4 |
512 |
||||||
59 |
85 |
3 |
255 |
||||||
60 |
160 |
3 |
480 |
||||||
61 |
60 |
1 |
60 |
||||||
62 |
41 |
1 |
41 |
||||||
63 |
90 |
4 |
360 |
||||||
64 |
83 |
4 |
332 |
||||||
65 |
45 |
1 |
45 |
||||||
66 |
39 |
1 |
39 |
||||||
67 |
86,9 |
3 |
260,7 |
||||||
68 |
40 |
1 |
40 |
||||||
69 |
80 |
2 |
160 |
||||||
70 |
227 |
4 |
908 |
||||||
71 |
235 |
4 |
940 |
||||||
72 |
40 |
1 |
40 |
||||||
73 |
67 |
1 |
67 |
||||||
74 |
123 |
4 |
492 |
||||||
75 |
100 |
3 |
300 |
||||||
76 |
105 |
3 |
315 |
||||||
77 |
70,3 |
2 |
140,6 |
||||||
78 |
82 |
3 |
246 |
||||||
79 |
280 |
4 |
1120 |
||||||
80 |
200 |
4 |
800 |
||||||
сумма |
4049,5 |
104 |
12532,4 |
||||||
среднее значение |
101,238 |
2,6 |
313,31 |
||||||
1. Анализируем тесноту связи между переменными Y и Х2 |
|||||||||
r yx = (yx - y*x)/(σx*σy) |
|||||||||
где, σx - среднее квадратичное отклонение переменной Х | |||||||||
σy - среднее квадратичное отклонение переменной Y |
|||||||||
Для их находжения выполняем следующие действия: |
|||||||||
вставка → fx → статистические → СТАНДОТКЛОН |
|||||||||
σx2 = |
1,194 |
||||||||
σy = |
57,291 |
||||||||
r yx = (313,31 -101,238*2,6) / (1,194*57,291) = |
0,732 |
||||||||
Ir yxI = 0,732 = связь между переменными тесная. |
|||||||||
2. Находим коэффициент детерминации: |
|||||||||
r² yx =( 0,732)² = |
0,536 |
т.е 53,6% изменения результата Y происходит под влиянием фактора Х2 | |||||||
3. Находим среднюю ошибку аппроксимации |
|||||||||
Eотн.ср.=1/n*∑ I Et/Yt I*100% |
|||||||||
Наблюдение |
Предска- |
Остатки Et |
Et /Yt |
IEt /YtI |
|||||
1 |
43,577 |
-5,577 |
-0,128 |
0,128 |
|||||
2 |
79,615 |
-17,415 |
-0,219 |
0,219 |
|||||
3 |
115,653 |
9,347 |
0,081 |
0,081 |
|||||
4 |
79,615 |
-18,515 |
-0,233 |
0,233 |
|||||
5 |
43,577 |
23,423 |
0,538 |
0,538 |
|||||
6 |
79,615 |
13,385 |
0,168 |
0,168 |
|||||
7 |
115,653 |
2,347 |
0,020 |
0,020 |
|||||
8 |
115,653 |
16,347 |
0,141 |
0,141 |
|||||
9 |
115,653 |
-23,153 |
-0,200 |
0,200 |
|||||
10 |
151,690 |
-46,690 |
-0,308 |
0,308 |
|||||
11 |
43,577 |
-1,577 |
-0,036 |
0,036 |
|||||
12 |
115,653 |
9,347 |
0,081 |
0,081 |
|||||
13 |
151,690 |
18,310 |
0,121 |
0,121 |
|||||
14 |
43,577 |
-5,577 |
-0,128 |
0,128 |
|||||
15 |
151,690 |
-21,190 |
-0,140 |
0,140 |
|||||
16 |
79,615 |
5,385 |
0,068 |
0,068 |
|||||
17 |
151,690 |
-53,690 |
-0,354 |
0,354 |
|||||
18 |
151,690 |
-23,690 |
-0,156 |
0,156 |
|||||
19 |
115,653 |
-30,653 |
-0,265 |
0,265 |
|||||
20 |
115,653 |
44,347 |
0,383 |
0,383 |
|||||
21 |
43,577 |
16,423 |
0,377 |
0,377 |
|||||
22 |
43,577 |
-2,577 |
-0,059 |
0,059 |
|||||
23 |
151,690 |
-61,690 |
-0,407 |
0,407 |
|||||
24 |
151,690 |
-68,690 |
-0,453 |
0,453 |
|||||
25 |
43,577 |
1,423 |
0,033 |
0,033 |
|||||
26 |
43,577 |
-4,577 |
-0,105 |
0,105 |
|||||
27 |
115,653 |
-28,753 |
-0,249 |
0,249 |
|||||
28 |
43,577 |
-3,577 |
-0,082 |
0,082 |
|||||
29 |
79,615 |
0,385 |
0,005 |
0,005 |
|||||
30 |
151,690 |
75,310 |
0,496 |
0,496 |
|||||
31 |
151,690 |
83,310 |
0,549 |
0,549 |
|||||
32 |
43,577 |
-3,577 |
-0,082 |
0,082 |
|||||
33 |
43,577 |
23,423 |
0,538 |
0,538 |
|||||
34 |
151,690 |
-28,690 |
-0,189 |
0,189 |
|||||
35 |
115,653 |
-15,653 |
-0,135 |
0,135 |
|||||
36 |
115,653 |
-10,653 |
-0,092 |
0,092 |
|||||
37 |
79,615 |
-9,315 |
-0,117 |
0,117 |
|||||
38 |
115,653 |
-33,653 |
-0,291 |
0,291 |
|||||
39 |
151,690 |
128,310 |
0,846 |
0,846 |
|||||
40 |
151,690 |
48,310 |
0,318 |
0,318 |
|||||
сумма |
9,190 |
||||||||
Eотн.ср.=1/40*9,190*100% = |
22,975 |
% |
|||||||
Так как Eотн.ср.> 7(10)%, то данная модель парной регресии не является точной. |
|||||||||
4. Находим F-критерий Фишера |
|||||||||
Fрасч = 49,174 (из таблицы дисперсионный анализ) |
|||||||||
Находим Fтабл (α; к1;к2) , где: |
|||||||||
α = 0.05 - вероятность |
|||||||||
к1 = m = 1 - число факторов в модели |
|||||||||
к2 = n-m-1 = 40-1-1 = 38 |
|||||||||
Fтабл (0.05; 1; 38)= |
4,098 |
||||||||
Сравниваем Fрасч и Fтабл |
|||||||||
49,174 > 4.098 , следовательно уравнение регрессии является значимым по критерию Фишера. |
|||||||||
Фактор Х4 |
|||||||||
Yрасч = -2,865 + 2,476*Х4 -линейное уравнение парной регрессии |
|||||||||
t |
Y |
X4 |
Y*Х4 |
||||||
41 |
38 |
19 |
722 |
||||||
42 |
62,2 |
36 |
2239,2 |
||||||
43 |
125 |
41 |
5125 |
||||||
44 |
61,1 |
34,8 |
2126,28 |
||||||
45 |
67 |
18,7 |
1252,9 |
||||||
46 |
93 |
27,7 |
2576,1 |
||||||
47 |
118 |
59 |
6962 |
||||||
48 |
132 |
44 |
5808 |
||||||
49 |
92,5 |
56 |
5180 |
||||||
50 |
105 |
47 |
4935 |
||||||
51 |
42 |
18 |
756 |
||||||
52 |
125 |
44 |
5500 |
||||||
53 |
170 |
56 |
9520 |
||||||
54 |
38 |
16 |
608 |
||||||
55 |
130,5 |
66 |
8613 |
||||||
56 |
85 |
34 |
2890 |
||||||
57 |
98 |
43 |
4214 |
||||||
58 |
128 |
59,2 |
7577,6 |
||||||
59 |
85 |
50 |
4250 |
||||||
60 |
160 |
42 |
6720 |
||||||
61 |
60 |
20 |
1200 |
||||||
62 |
41 |
14 |
574 |
||||||
63 |
90 |
47 |
4230 |
||||||
64 |
83 |
49,5 |
4108,5 |
||||||
65 |
45 |
18,9 |
850,5 |
||||||
66 |
39 |
18 |
702 |
||||||
67 |
86,9 |
58,7 |
5101,03 |
||||||
68 |
40 |
22 |
880 |
||||||
69 |
80 |
40 |
3200 |
||||||
70 |
227 |
91 |
20657 |
||||||
71 |
235 |
90 |
21150 |
||||||
72 |
40 |
15 |
600 |
||||||
73 |
67 |
18,5 |
1239,5 |
||||||
74 |
123 |
55 |
6765 |
||||||
75 |
100 |
37 |
3700 |
||||||
76 |
105 |
48 |
5040 |
||||||
77 |
70,3 |
34,8 |
2446,44 |
||||||
78 |
82 |
48 |
3936 |
||||||
79 |
280 |
85 |
23800 |
||||||
80 |
200 |
60 |
12000 |
||||||
сумма |
4049,5 |
1681,8 |
209755,05 |
||||||
среднее значение |
101,238 |
42,045 |
5243,876 |
||||||
1. Анализируем тесноту связи между переменными Y и Х4 |
|||||||||
r yx = (yx - y*x)/(σx*σy) |
|||||||||
где, σx - среднее квадратичное отклонение переменной Х | |||||||||
σy - среднее квадратичное отклонение переменной Y |
|||||||||
Для их находжения выполняем следующие действия: |
|||||||||
вставка → fx → статистические → СТАНДОТКЛОН |
|||||||||
σx4 = |
20,224 |
||||||||
σy = |
57,291 |
||||||||
r yx = (5243,876 -101,238*42,045) / (20,224*57,291) = |
0,852 |
||||||||
Ir yxI = 0,852 = связь между переменными тесная. |
|||||||||
2. Находим коэффициент детерминации: |
|||||||||
r² yx =( 0,852)² = |
0,726 |
т.е 72,6% изменения результата Y происходит под влиянием фактора Х4 | |||||||
3. Находим среднюю ошибку аппроксимации |
|||||||||
Eотн.ср.=1/n*∑ I Et/Yt I*100% |
|||||||||
Наблюдение |
Предска- |
Остатки Et |
Et /Yt |
IEt /YtI |
|||||
1 |
44,179 |
-6,179 |
-0,140 |
0,140 |
|||||
2 |
86,270 |
-24,070 |
-0,279 |
0,279 |
|||||
3 |
98,650 |
26,350 |
0,267 |
0,267 |
|||||
4 |
83,299 |
-22,199 |
-0,266 |
0,266 |
|||||
5 |
43,436 |
23,564 |
0,543 |
0,543 |
|||||
6 |
65,720 |
27,280 |
0,415 |
0,415 |
|||||
7 |
143,218 |
-25,218 |
-0,176 |
0,176 |
|||||
8 |
106,078 |
25,922 |
0,244 |
0,244 |
|||||
9 |
135,790 |
-43,290 |
-0,319 |
0,319 |
|||||
10 |
113,506 |
-8,506 |
-0,075 |
0,075 |
|||||
11 |
41,703 |
0,297 |
0,007 |
0,007 |
|||||
12 |
106,078 |
18,922 |
0,178 |
0,178 |
|||||
13 |
135,790 |
34,210 |
0,252 |
0,252 |
|||||
14 |
36,751 |
1,249 |
0,034 |
0,034 |
|||||
15 |
160,549 |
-30,049 |
-0,187 |
0,187 |
|||||
16 |
81,318 |
3,682 |
0,045 |
0,045 |
|||||
17 |
103,602 |
-5,602 |
-0,054 |
0,054 |
|||||
18 |
143,713 |
-15,713 |
-0,109 |
0,109 |
|||||
19 |
120,934 |
-35,934 |
-0,297 |
0,297 |
|||||
20 |
101,126 |
58,874 |
0,582 |
0,582 |
|||||
21 |
46,655 |
13,345 |
0,286 |
0,286 |
|||||
22 |
31,799 |
9,201 |
0,289 |
0,289 |
|||||
23 |
113,506 |
-23,506 |
-0,207 |
0,207 |
|||||
24 |
119,696 |
-36,696 |
-0,307 |
0,307 |
|||||
25 |
43,931 |
1,069 |
0,024 |
0,024 |
|||||
26 |
41,703 |
-2,703 |
-0,065 |
0,065 |
|||||
27 |
142,475 |
-55,575 |
-0,390 |
0,390 |
|||||
28 |
51,607 |
-11,607 |
-0,225 |
0,225 |
|||||
29 |
96,174 |
-16,174 |
-0,168 |
0,168 |
|||||
30 |
222,449 |
4,551 |
0,020 |
0,020 |
|||||
31 |
219,973 |
15,027 |
0,068 |
0,068 |
|||||
32 |
34,275 |
5,725 |
0,167 |
0,167 |
|||||
33 |
42,941 |
24,059 |
0,560 |
0,560 |
|||||
34 |
133,314 |
-10,314 |
-0,077 |
0,077 |
|||||
35 |
88,746 |
11,254 |
0,127 |
0,127 |
|||||
36 |
115,982 |
-10,982 |
-0,095 |
0,095 |
|||||
37 |
83,299 |
-12,999 |
-0,156 |
0,156 |
|||||
38 |
115,982 |
-33,982 |
-0,293 |
0,293 |
|||||
39 |
207,593 |
72,407 |
0,349 |
0,349 |
|||||
40 |
145,694 |
54,306 |
0,373 |
0,373 |
|||||
сумма |
8,718 |
||||||||
Eотн.ср.=1/40*8,718*100% = |
21,794 |
% |
|||||||
Так как Eотн.ср.> 7(10)%, то данная модель парной регресии не является точной. |
|||||||||
4. Находим F-критерий Фишера |
|||||||||
Fрасч = 122,947 (из таблицы дисперсионный анализ) |
|||||||||
Находим Fтабл (α; к1;к2) , где: |
|||||||||
α = 0.05 - вероятность |
|||||||||
к1 = m = 1 - число факторов в модели |
|||||||||
к2 = n-m-1 = 40-1-1 = 38 |
|||||||||
Fтабл (0.05; 1; 38)= |
4,098 |
||||||||
Сравниваем Fрасч и Fтабл |
|||||||||
122,947 > 4.098 , следовательно уравнение регрессии является значимым по критерию Фишера. |
|||||||||
По найденным параметрам выбираем лучшую модель: |
|||||||||
Лучшей считается та модель,
для которой R-квадрат (коэффициент
детерминации) наибольший, |
|||||||||
Модель с фактором X1 |
Модель с фактором X2 |
Модель с фактором X4 |
|||||||
r² yx =0,0001 |
r² yx = 0,536 |
r² yx = 0,726 |
|||||||
Eотн.ср.=41,830 |
Eотн.ср.=22,975 |
Eотн.ср.=21,794 |
|||||||
Fрасч<Fтабл |
Fрасч>Fтабл |
Fрасч>Fтабл |
|||||||
0,005<4,098 |
49,174>4,098 |
122,947>4,098 |
|||||||
Следовательно, лучшей считается модель с факторомХ4 |
|||||||||
Yрасч = -2,865 + 2,476*Х4 |
|||||||||
Задание 5.Осуществите прогнозирование для лучшей модели среднего значения показателя Y при уровне значимости α=0,1, ели прогнозное значение фактора Y составит 80 % от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза. | |||||||||
Yрасч = -2,865 + 2,476*Х4 |
|||||||||
X4 прогн = 80% *Х4max = 80%*91= |
72,8 |
(кв.м.) |
|||||||
Точечный прогноз: |
|||||||||
Yрасч (прогн) =Yрасч(Xпрогн) |
|||||||||
Yрасч (прогн) = -2,865 + 2,476*72,8 = |
177,388 |
(тыс.долл.) |
|||||||
На графике "Поле корреляции" отмечаем точку (177,4; 72,8), она должна лежать на прямой линии |
|||||||||
Интервальный прогноз: |
|||||||||
Yрасч (прогн) ± tα*Sпрогн |
|||||||||
tα = tтабл (α;n-m-1) = tтабл (0,1;40-1-1) = tтабл (0,1;38) = |
1,686 |
||||||||
где α=0,1- уровень значимости |
|||||||||
n = 40 - количество наблюдений |
|||||||||
m = 1 - количество факторов в модели |
|||||||||
Среднеквадратичная ошибка прогноза: |
|||||||||
Sпрогн=Sy расч*√1+1/n+(Хпр-Хср)² / Σ(Хt-Хср)² |
|||||||||
Y |
X4 |
(X-Xср)^2 |
|||||||
38 |
19 |
531,072 |
|||||||
62,2 |
36 |
36,542 |
|||||||
125 |
41 |
1,092 |
|||||||
61,1 |
34,8 |
52,490 |
|||||||
67 |
18,7 |
544,989 |
|||||||
93 |
27,7 |
205,779 |
|||||||
118 |
59 |
287,472 |
|||||||
132 |
44 |
3,822 |
|||||||
92,5 |
56 |
194,742 |
|||||||
105 |
47 |
24,552 |
|||||||
42 |
18 |
578,162 |
|||||||
125 |
44 |
3,822 |
|||||||
170 |
56 |
194,742 |
|||||||
38 |
16 |
678,342 |
|||||||
130,5 |
66 |
573,842 |
|||||||
85 |
34 |
64,722 |
|||||||
98 |
43 |
0,912 |
|||||||
128 |
59,2 |
294,294 |
|||||||
85 |
50 |
63,282 |
|||||||
160 |
42 |
0,002 |
|||||||
60 |
20 |
485,982 |
|||||||
41 |
14 |
786,522 |
|||||||
90 |
47 |
24,552 |
|||||||
83 |
49,5 |
55,577 |
|||||||
45 |
18,9 |
535,691 |
|||||||
39 |
18 |
578,162 |
|||||||
86,9 |
58,7 |
277,389 |
|||||||
40 |
22 |
401,802 |
|||||||
80 |
40 |
4,182 |
|||||||
227 |
91 |
2396,592 |
|||||||
235 |
90 |
2299,682 |
|||||||
40 |
15 |
731,432 |
|||||||
67 |
18,5 |
554,367 |
|||||||
123 |
55 |
167,832 |
|||||||
100 |
37 |
25,452 |
|||||||
105 |
48 |
35,462 |
|||||||
70,3 |
34,8 |
52,490 |
|||||||
82 |
48 |
35,462 |
|||||||
280 |
85 |
1845,132 |
|||||||
200 |
60 |
322,382 |
|||||||
сумма |
1681,8 |
15950,819 |
|||||||
Xср =42,045 | |||||||||
∑(X-Xсред)^2 = |
15950,819 |
||||||||
(Xпрогн-Xсред)^2 = |
945,870 |
||||||||
Sy расч = |
28,202 |
||||||||
Sпрогн= 28,202 *√1+1/40+945,870/15950,819 = |
29,367 |
||||||||
Ширина доверительного интервала = ± tα*Sпрогн =1,686*29,367= |
49,511 |
||||||||
Интервальный прогноз: |
177,388 ± 49,511 |
||||||||
(127,877÷226,899) |
|||||||||
Нижняя граница |
127,877 |
||||||||
Верхняя граница |
226,899 |
||||||||
На графике "Поле корреляции" представим: фактические и модельные значения, точки прогноза. |
|||||||||
|
|||||||||
Задание 6. Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены квартиры за счёт значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии. | |||||||||
Дано: |
|||||||||
Yрасч(X1,X2,X4)=a0+a1*X1+a2* |
|||||||||
t |
Y |
X1 |
X2 |
X4 |
|||||
41 |
38 |
1 |
1 |
19 |
|||||
42 |
62,2 |
1 |
2 |
36 |
|||||
43 |
125 |
0 |
3 |
41 |
|||||
44 |
61,1 |
1 |
2 |
34,8 |
|||||
45 |
67 |
0 |
1 |
18,7 |
|||||
46 |
93 |
0 |
2 |
27,7 |
|||||
47 |
118 |
1 |
3 |
59 |
|||||
48 |
132 |
0 |
3 |
44 |
|||||
49 |
92,5 |
0 |
3 |
56 |
|||||
50 |
105 |
1 |
4 |
47 |
|||||
51 |
42 |
1 |
1 |
18 |
|||||
52 |
125 |
1 |
3 |
44 |
|||||
53 |
170 |
0 |
4 |
56 |
|||||
54 |
38 |
0 |
1 |
16 |
|||||
55 |
130,5 |
0 |
4 |
66 |
|||||
56 |
85 |
0 |
2 |
34 |
|||||
57 |
98 |
0 |
4 |
43 |
|||||
58 |
128 |
0 |
4 |
59,2 |
|||||
59 |
85 |
0 |
3 |
50 |
|||||
60 |
160 |
1 |
3 |
42 |
|||||
61 |
60 |
0 |
1 |
20 |
|||||
62 |
41 |
1 |
1 |
14 |
|||||
63 |
90 |
1 |
4 |
47 |
|||||
64 |
83 |
0 |
4 |
49,5 |
|||||
65 |
45 |
0 |
1 |
18,9 |
|||||
66 |
39 |
0 |
1 |
18 |
|||||
67 |
86,9 |
0 |
3 |
58,7 |
|||||
68 |
40 |
0 |
1 |
22 |
|||||
69 |
80 |
0 |
2 |
40 |
|||||
70 |
227 |
0 |
4 |
91 |
|||||
71 |
235 |
0 |
4 |
90 |
|||||
72 |
40 |
1 |
1 |
15 |
|||||
73 |
67 |
1 |
1 |
18,5 |
|||||
74 |
123 |
1 |
4 |
55 |
|||||
75 |
100 |
0 |
3 |
37 |
|||||
76 |
105 |
1 |
3 |
48 |
|||||
77 |
70,3 |
1 |
2 |
34,8 |
|||||
78 |
82 |
1 |
3 |
48 |
|||||
79 |
280 |
1 |
4 |
85 |
|||||
80 |
200 |
1 |
4 |
60 |
|||||
Строим множественную регрессионную модель ( сервис → анализ данных → регрессия ). |
|||||||||
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,876 |
||||||||
R-квадрат |
0,768 |
||||||||
Нормированный |
0,748 |
||||||||
Стандартная |
28,737 |
||||||||
Наблюдения |
40 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
3 |
98279,906 |
32759,969 |
39,670 |
1,66704E-11 |
||||
Остаток |
36 |
29729,088 |
825,808 |
||||||
Итого |
39 |
128008,994 |
|||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
-5,644 |
12,073 |
-0,467 |
0,643 |
-30,128 |
18,841 |
|||
X1 |
6,860 |
9,186 |
0,747 |
0,460 |
-11,770 |
25,489 |
|||
X2 |
-1,985 |
7,795 |
-0,255 |
0,800 |
-17,795 |
13,825 |
|||
X4 |
2,591 |
0,461 |
5,616 |
0,000 |
1,656 |
3,527 |
|||
ВЫВОД ОСТАТКА |
|
||||||||
Наблюдение |
Предска- |
Остатки |
|||||||
1 |
48,468 |
-10,468 | |||||||
2 |
90,536 |
-28,336 | |||||||
3 |
94,649 |
30,351 | |||||||
4 |
87,427 |
-26,327 | |||||||
5 |
40,831 |
26,169 | |||||||
6 |
62,168 |
30,832 | |||||||
7 |
148,154 |
-30,154 | |||||||
8 |
102,423 |
29,577 | |||||||
9 |
133,520 |
-41,020 | |||||||
10 |
115,071 |
-10,071 |
| ||||||
11 |
45,876 |
-3,876 | |||||||
12 |
109,282 |
15,718 | |||||||
13 |
131,535 |
38,465 | |||||||
14 |
33,834 |
4,166 | |||||||
15 |
157,449 |
-26,949 | |||||||
16 |
78,494 |
6,506 | |||||||
17 |
97,846 |
0,154 | |||||||
18 |
139,827 |
-11,827 | |||||||
19 |
117,971 |
-32,971 | |||||||
20 |
104,100 |
55,900 | |||||||
21 |
44,199 |
15,801 |
|||||||
22 |
35,511 |
5,489 | |||||||
23 |
115,071 |
-25,071 | |||||||
24 |
114,690 |
-31,690 | |||||||
25 |
41,349 |
3,651 | |||||||
26 |
39,017 |
-0,017 | |||||||
27 |
140,516 |
-53,616 | |||||||
28 |
49,382 |
-9,382 | |||||||
29 |
94,042 |
-14,042 | |||||||
30 |
222,234 |
4,766 | |||||||
31 |
219,642 |
15,358 | |||||||
32 |
38,102 |
1,898 |
|||||||
33 |
47,172 |
19,828 |
|||||||
34 |
135,803 |
-12,803 |
|||||||
35 |
84,283 |
15,717 |
|||||||
36 |
119,648 |
-14,648 |
|||||||
37 |
87,427 |
-17,127 |
|||||||
38 |
119,648 |
-37,648 |
|||||||
39 |
213,545 |
66,455 |
|||||||
40 |
148,760 |
51,240 |
|||||||
Yрасч(X1,X2,X4) = - 5,644+ 6,860*X1-1,985*X2+2,591*X4 - линейное уравнение множественной регрессии |
|||||||||
Проверяем значимость коэффициентов парной корреляции, для этого применяем критерий Стьюдента |
|||||||||
tтабл (α;n-m-1) = |
tтабл (0,05;40-3-1=36) = |
2,028 |
|||||||
t (aj) |
It (aj)I |
||||||||
t(a0)= |
-0,467 |
0,467 |
не значим |
||||||
t(a1)= |
0,747 |
0,747 |
не значим |
||||||
t(a2)= |
-0,255 |
0,255 |
не значим |
||||||
t(a4)= |
5,616 |
5,616 |
значим |
||||||
Параметры а0,а1,а2 не значимы и факторы Х1, Х2 при этих параметрах следует исключить |
|||||||||
Снова находим линейное уравнение регрессии с одним фактором: |
|||||||||
Yрасч(X4)=a4*X4 |
|||||||||
t |
Y |
X4 |
(Y-Yсред) |
(Y-Yсред)² |
(X4-X4сред) |
(X4-X4сред)² |
|||
41 |
38 |
19 |
-139,238 |
19387,081 |
-23,045 |
531,072 |
|||
42 |
62,2 |
36 |
-163,438 |
26711,816 |
-6,045 |
36,542 |
|||
43 |
125 |
41 |
-226,238 |
51183,406 |
3,000 |
9,000 |
|||
44 |
61,1 |
34,8 |
-162,338 |
26353,464 |
-7,245 |
52,490 |
|||
45 |
67 |
18,7 |
-168,238 |
28303,856 |
-23,345 |
544,989 |
|||
46 |
93 |
27,7 |
-194,238 |
37728,206 |
-14,345 |
205,779 |
|||
47 |
118 |
59 |
-219,238 |
48065,081 |
16,955 |
287,472 |
|||
48 |
132 |
44 |
-233,238 |
54399,731 |
1,955 |
3,822 |
|||
49 |
92,5 |
56 |
-193,738 |
37534,219 |
13,955 |
194,742 |
|||
50 |
105 |
47 |
-206,238 |
42533,906 |
4,955 |
24,552 |
|||
51 |
42 |
18 |
-143,238 |
20516,981 |
-24,045 |
578,162 |
|||
52 |
125 |
44 |
-226,238 |
51183,406 |
1,955 |
3,822 |
|||
53 |
170 |
56 |
-271,238 |
73569,781 |
13,955 |
194,742 |
|||
54 |
38 |
16 |
-139,238 |
19387,081 |
-26,045 |
678,342 |
|||
55 |
130,5 |
66 |
-231,738 |
53702,269 |
23,955 |
573,842 |
|||
56 |
85 |
34 |
-186,238 |
34684,406 |
-8,045 |
64,722 |
|||
57 |
98 |
43 |
-199,238 |
39695,581 |
0,955 |
0,912 |
|||
58 |
128 |
59,2 |
-229,238 |
52549,831 |
17,155 |
294,294 |
|||
59 |
85 |
50 |
-186,238 |
34684,406 |
7,955 |
63,282 |
|||
60 |
160 |
42 |
-261,238 |
68245,031 |
-0,045 |
0,002 |
|||
61 |
60 |
20 |
-161,238 |
25997,531 |
-22,045 |
485,982 |
|||
62 |
41 |
14 |
-142,238 |
20231,506 |
-28,045 |
786,522 |
|||
63 |
90 |
47 |
-191,238 |
36571,781 |
4,955 |
24,552 |
|||
64 |
83 |
49,5 |
-184,238 |
33943,456 |
7,455 |
55,577 |
|||
65 |
45 |
18,9 |
-146,238 |
21385,406 |
-23,145 |
535,691 |
|||
66 |
39 |
18 |
-140,238 |
19666,556 |
-24,045 |
578,162 |
|||
67 |
86,9 |
58,7 |
-188,138 |
35395,719 |
16,655 |
277,389 |
|||
68 |
40 |
22 |
-141,238 |
19948,031 |
-20,045 |
401,802 |
|||
69 |
80 |
40 |
-181,238 |
32847,031 |
-2,045 |
4,182 |
|||
70 |
227 |
91 |
-328,238 |
107739,856 |
48,955 |
2396,592 |
|||
71 |
235 |
90 |
-336,238 |
113055,656 |
47,955 |
2299,682 |
|||
72 |
40 |
15 |
-141,238 |
19948,031 |
-27,045 |
731,432 |
|||
73 |
67 |
18,5 |
-168,238 |
28303,856 |
-23,545 |
554,367 |
|||
74 |
123 |
55 |
-224,238 |
50282,456 |
12,955 |
167,832 |
|||
75 |
100 |
37 |
-201,238 |
40496,531 |
-5,045 |
25,452 |
|||
76 |
105 |
48 |
-206,238 |
42533,906 |
5,955 |
35,462 |
|||
77 |
70,3 |
34,8 |
-171,538 |
29425,114 |
-7,245 |
52,490 |
|||
78 |
82 |
48 |
-183,238 |
33575,981 |
5,955 |
35,462 |
|||
79 |
280 |
85 |
-381,238 |
145342,031 |
42,955 |
1845,132 |
|||
80 |
200 |
60 |
-301,238 |
90744,031 |
17,955 |
322,382 |
|||
сумма |
4049,5 |
1681,8 |
1767854,019 |
15958,727 |
|||||
среднее значение |
101,238 |
42,045 |
|||||||
Строи регрессионную модель с одним фактором Х4 (сервис → анализ данных → регрессия). | |||||||||
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,874 |
||||||||
R-квадрат |
0,764 |
||||||||
Нормированный |
0,758 |
||||||||
Стандартная |
28,202 |
||||||||
Наблюдения |
40 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
97785,701 |
97785,701 |
122,947 |
1,79185E-13 |
||||
Остаток |
38 |
30223,293 |
795,350 |
||||||
Итого |
39 |
128008,994 |
|||||||
|
|||||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
-2,865 |
10,394 |
-0,276 |
0,784 |
-23,906 |
18,176 |
|||
X4 |
2,476 |
0,223 |
11,088 |
0,000 |
2,024 |
2,928 |
|||
ВЫВОД ОСТАТКА |
| ||||||||
Наблюдение |
Предска- |
Остатки | |||||||
1 |
44,179 |
-6,179 | |||||||
2 |
86,270 |
-24,070 | |||||||
3 |
98,650 |
26,350 | |||||||
4 |
83,299 |
-22,199 | |||||||
5 |
43,436 |
23,564 | |||||||
6 |
65,720 |
27,280 | |||||||
7 |
143,218 |
-25,218 | |||||||
8 |
106,078 |
25,922 | |||||||
9 |
135,790 |
-43,290 | |||||||
10 |
113,506 |
-8,506 | |||||||
11 |
41,703 |
0,297 |
|||||||
12 |
106,078 |
18,922 |
|||||||
13 |
135,790 |
34,210 |
|||||||
14 |
36,751 |
1,249 |
|||||||
15 |
160,549 |
-30,049 |
|||||||
16 |
81,318 |
3,682 |
|||||||
17 |
103,602 |
-5,602 |
|||||||
18 |
143,713 |
-15,713 |
|||||||
19 |
120,934 |
-35,934 |
|||||||
20 |
101,126 |
58,874 |
|||||||
21 |
46,655 |
13,345 |
|||||||
22 |
31,799 |
9,201 |
|||||||
23 |
113,506 |
-23,506 |
|||||||
24 |
119,696 |
-36,696 |
|||||||
25 |
43,931 |
1,069 |
|||||||
26 |
41,703 |
-2,703 |
|||||||
27 |
142,475 |
-55,575 |
|||||||
28 |
51,607 |
-11,607 |
|||||||
29 |
96,174 |
-16,174 |
|||||||
30 |
222,449 |
4,551 |
|||||||
31 |
219,973 |
15,027 |
|||||||
32 |
34,275 |
5,725 |
|||||||
33 |
42,941 |
24,059 |
|||||||
34 |
133,314 |
-10,314 |
|||||||
35 |
88,746 |
11,254 |
|||||||
36 |
115,982 |
-10,982 |
|||||||
37 |
83,299 |
-12,999 |
|||||||
38 |
115,982 |
-33,982 |
|||||||
39 |
207,593 |
72,407 |
|||||||
40 |
145,694 |
54,306 |
|||||||
Yрасч = -2,865 + 2,476*Х4 -линейное уравнение регрессии с одним фактором. |
|||||||||
Экономическая интерпретация
коэффициентов уравнения |
|||||||||
Yрасч(X4) - цена квартиры (тыс.долл) |
|||||||||
X4 - жилая площадь квартиры (кв.м) |
|||||||||
а4=2,476 - коэффициент регрессии, который показывает: |
|||||||||
1) направлениесвязи между результатом Y и X4; |
|||||||||
2) на сколько в среднем изменится значение результата Y, если один из факторов X4 увеличить на единицу измерения. |
|||||||||
связь между Y и X4 прямая, если X4 (жилая площадь квартиры) увеличить на 1кв.м, то Y (цена квартиры) возрастет на 2,476 тыс.долл. |
|||||||||
Множественный R |
0,874 |
коэффициент множественной корреляции, показывает тесноту связи переменной Y с фактором X4 |
|||||||
чем ближе IRI к 1,тем выше качество модели→качество модели высокое | |||||||||
R-квадрат
|
0,764
|
коэффициент детерминации, показывает долю вариации результативного признака под воздействием изучаемого фактора. |
|||||||
→76,4% изменения результата Y происходит под влиянием факторов X4, включенного в модель. |
|||||||||
чем ближе R² к 1, тем выше точность, а значит и качество модели. |
|||||||||
Нормированный |
0,758 |
||||||||
Стандартная |
28,202 |
Syрасч |
|||||||
Наблюдения |
40 |
n |
|||||||
Задание 7. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ-коэффициентов. | |||||||||
Построенная модель однофакторная. |
|||||||||
Yрасч = -2,865 + 2,476*Х4 -линейное уравнение регрессии. |
|||||||||
1. Проверка качества уравнения регрессии: |
|||||||||
а) анализируем тесноту связи между переменными с помощью коэффициента парной корреляции: |
|||||||||
(применим данные из Задания 4) |
|||||||||
r yx4 = 0,852 - связь между переменные прямая, очень тесная. |
|||||||||
б) находим коэффициент детерминации: |
|||||||||
r² yx =( 0,852)² = |
0,726 |
т.е 72,6% изменения результата Y происходит под влиянием фактора Х4 | |||||||
2. Проверка значимости
уравнения регрессии по |
|||||||||
(применим данные из Задания 4) |
|||||||||
Fрасч = 122,947 (из таблицы дисперсионный анализ) |
|||||||||
Находим Fтабл (α; к1;к2) |
|||||||||
Fтабл (0.05; 1; 38)= |
4,098 |
||||||||
Сравниваем Fрасч и Fтабл |
|||||||||
122,947 > 4.098 , следовательно уравнение регрессии является значимым по критерию Фишера. |
|||||||||
3. Проверка значимости
параметров уравнения |
|||||||||
tr = √r² *(n-2) / (1-r²)= |
10,034 |
||||||||
где n=40 - количество наблюдений |
|||||||||
t табл (α; n -2) = |
t табл (0.05;40-2)= |
t табл (0.05; 38) = |
2,024 |
||||||
I tr I > t табл. |
|||||||||
10,034 > 2,024, следовательно фактор r значим |
|||||||||
4. Проверка выполнения
предпосылок МНК (метод |
|||||||||
а) Случайность колебаний значений остатков (критерий поворотных точек или пиков) |
|||||||||
(применим данные из Задания 6) |
|||||||||
Предсказанное |
Остатки E(t) |
m |
E²(t) |
(E(t)-E(t-1))^2 |
|E(t)| |
E(t)/ |
IE(t)/ | ||
44,179 |
-6,179 |
- |
38,176 |
- |
6,179 |
-0,140 |
0,140 | ||
86,270 |
-24,070 |
1 |
579,376 |
320,108 |
24,070 |
-0,279 |
0,279 | ||
98,650 |
26,350 |
1 |
694,317 |
2542,189 |
26,350 |
0,267 |
0,267 | ||
83,299 |
-22,199 |
1 |
492,798 |
2357,001 |
22,199 |
-0,266 |
0,266 | ||
43,436 |
23,564 |
0 |
555,268 |
2094,270 |
23,564 |
0,543 |
0,543 | ||
65,720 |
27,280 |
1 |
744,218 |
13,810 |
27,280 |
0,415 |
0,415 | ||
143,218 |
-25,218 |
1 |
635,930 |
2756,040 |
25,218 |
-0,176 |
0,176 | ||
106,078 |
25,922 |
1 |
671,949 |
2615,261 |
25,922 |
0,244 |
0,244 | ||
135,790 |
-43,290 |
1 |
1874,000 |
4790,259 |
43,290 |
-0,319 |
0,319 | ||
113,506 |
-8,506 |
0 |
72,351 |
1209,911 |
8,506 |
-0,075 |
0,075 | ||
41,703 |
0,297 |
0 |
0,088 |
77,497 |
0,297 |
0,007 |
0,007 | ||
106,078 |
18,922 |
0 |
358,041 |
346,878 |
18,922 |
0,178 |
0,178 | ||
135,790 |
34,210 |
1 |
1170,343 |
233,732 |
34,210 |
0,252 |
0,252 | ||
36,751 |
1,249 |
0 |
1,561 |
1086,429 |
1,249 |
0,034 |
0,034 | ||
160,549 |
-30,049 |
1 |
902,971 |
979,610 |
30,049 |
-0,187 |
0,187 | ||
81,318 |
3,682 |
1 |
13,555 |
1137,793 |
3,682 |
0,045 |
0,045 | ||
103,602 |
-5,602 |
0 |
31,383 |
86,188 |
5,602 |
-0,054 |
0,054 | ||
143,713 |
-15,713 |
0 |
246,893 |
102,228 |
15,713 |
-0,109 |
0,109 | ||
120,934 |
-35,934 |
1 |
1291,244 |
408,890 |
35,934 |
-0,297 |
0,297 | ||
101,126 |
58,874 |
1 |
3466,138 |
8988,518 |
58,874 |
0,582 |
0,582 | ||
46,655 |
13,345 |
0 |
178,099 |
2072,850 |
13,345 |
0,286 |
0,286 | ||
31,799 |
9,201 |
0 |
84,662 |
17,174 |
9,201 |
0,289 |
0,289 | ||
113,506 |
-23,506 |
0 |
552,530 |
1069,758 |
23,506 |
-0,207 |
0,207 | ||
119,696 |
-36,696 |
1 |
1346,588 |
173,974 |
36,696 |
-0,307 |
0,307 | ||
43,931 |
1,069 |
1 |
1,143 |
1426,182 |
1,069 |
0,024 |
0,024 | ||
41,703 |
-2,703 |
0 |
7,305 |
14,225 |
2,703 |
-0,065 |
0,065 | ||
142,475 |
-55,575 |
1 |
3088,565 |
2795,466 |
55,575 |
-0,390 |
0,390 | ||
51,607 |
-11,607 |
1 |
134,713 |
1933,209 |
11,607 |
-0,225 |
0,225 | ||
96,174 |
-16,174 |
1 |
261,603 |
20,862 |
16,174 |
-0,168 |
0,168 | ||
222,449 |
4,551 |
0 |
20,713 |
429,538 |
4,551 |
0,020 |
0,020 | ||
219,973 |
15,027 |
1 |
225,815 |
109,746 |
15,027 |
0,068 |
0,068 | ||
34,275 |
5,725 |
1 |
32,778 |
86,525 |
5,725 |
0,167 |
0,167 | ||
42,941 |
24,059 |
1 |
578,851 |
336,139 |
24,059 |
0,560 |
0,560 | ||
133,314 |
-10,314 |
1 |
106,373 |
1181,508 |
10,314 |
-0,077 |
0,077 | ||
88,746 |
11,254 |
1 |
126,648 |
465,159 |
11,254 |
0,127 |
0,127 | ||
115,982 |
-10,982 |
0 |
120,603 |
494,427 |
10,982 |
-0,095 |
0,095 | ||
83,299 |
-12,999 |
0 |
168,976 |
4,069 |
12,999 |
-0,156 |
0,156 | ||
115,982 |
-33,982 |
1 |
1154,771 |
440,281 |
33,982 |
-0,293 |
0,293 | ||
207,593 |
72,407 |
1 |
5242,775 |
11318,607 |
72,407 |
0,349 |
0,349 | ||
145,694 |
54,306 |
- |
2949,183 |
327,633 |
54,306 |
0,373 |
0,373 | ||
сумма |
0,000 |
24 |
30223,293 |
56863,946 |
862,593 |
8,718 | |||
m > [2*(n-2)/3 - 2*√(16n-29)/90] |
|||||||||
m-количество поворотных точек |
|||||||||
n=40 - количество наблюдений |
|||||||||
Точка m считается поворотной, если она больше предшествующей и последующей или меньше предшествующей и последующей (или меньше). | |||||||||
m > [2*(40-2)/3 - 2*√(16*40-29)/90] = [20,12] = 20 |
|||||||||
в модели получилось 24 поворотных точек. |
|||||||||
24 > 20, неравенство выполняется, следовательно свойство выполняется. |
|||||||||
|
|||||||||
б) Отсутствие автокорреляции в ряду остатков. |
|||||||||
Остатки должны быть независимы. Применяем критерий Дарбина-Уотсона. |
|||||||||
dрасч = Σ (Et-Et-1)² / Σ E²t = 56 863,946 / 30 223,293 = |
1,881 |
||||||||
0< d расч ≤ 4 |
|||||||||
0 < 1,881 ≤ 4 - неравенство выполняется. |
|||||||||
Сравниваем d расч с двумя табличными: при уровне значимости α= 5% и n=40 |
|||||||||
d1=1,35 |
|||||||||
d2=1,49 |
|||||||||
2 случай) d2 < d расч ≤ 2 |
|||||||||
1,49 < 1,881 ≤ 2 - т.е. свойство
выполняется, автокорреляция |
|||||||||
в) Подчинение остатков нормальному закону распределения (закон Гаусса). |
|||||||||
Применяем RS-критерий |
|||||||||
(R/S) = (Emax-Emin) / Se |
, где: |
||||||||
Emax= |
72,407 |
||||||||
Emin= |
-55,575 |
||||||||
Se - СКО остаточной последовательности |
|||||||||
Se= √ (n*Σ E²(t)-(Σ Et)² / n*(n-1) |
|||||||||
Se= √ (40*30 223,293 - (0,000)² / 40*(40-1) = |
27,838 |
||||||||
(R/S) = (72,407-(- 55,575) / 27,838 = |
4,597 |
||||||||
Сравниваем R/S с двумя табличными значениями: при уровне значимости α= 5% и n=40 |
|||||||||
Критические границы отношения: |
|||||||||
R/S=(3,67÷5,16) |
|||||||||
Расчетный критерий 4,597 попадает внутрь табличного интервала, следовательно свойство выполняется. | |||||||||
г) Проверяем равенство М(Е)=0 или Есред=0 |
|||||||||
применяем критерий Стьюдента: |
|||||||||
tрасч = ( IЕсред(t)I / Se) * √n |
|||||||||
IЕсред(t)I = I 0/40 I = 0 |
|||||||||
tрасч=0 |
|||||||||
tтабл (α ;n-1) = tтабл (0,05;40-1)= t табл (0,05;39) = |
2,023 |
||||||||
tрасч < tтабл |
|||||||||
0 < 2,023, следовательно свойство выполняется. |
|||||||||
д) Проверяем гомоскедастичность остатков, то есть дисперсия остатков должна быть одинакова для каждого значения X4. | |||||||||
Из графика видно, что дисперсия остатков не одинакова ,т.е. имеет место гетероскедостичность |
|||||||||
Применяем тест Голдфельда-Квандрта (для обнаружения гетероскедостичности). |
|||||||||
Упорядочим наблюдения по мере возрастания переменой X4. |
|||||||||
Y |
X4 |
||||||||
41 |
14 |
||||||||
40 |
15 |
||||||||
38 |
16 |
||||||||
39 |
18 |
||||||||
42 |
18 |
||||||||
67 |
18,5 |
||||||||
67 |
18,7 |
||||||||
45 |
18,9 |
||||||||
38 |
19 |
||||||||
60 |
20 |
||||||||
40 |
22 |
||||||||
93 |
27,7 |
||||||||
85 |
34 |
||||||||
61,1 |
34,8 |
||||||||
70,3 |
34,8 |
||||||||
62,2 |
36 |
||||||||
100 |
37 |
||||||||
80 |
40 |
||||||||
125 |
41 |
||||||||
160 |
42 |
||||||||
98 |
43 |
||||||||
125 |
44 |
||||||||
132 |
44 |
||||||||
90 |
47 |
||||||||
105 |
47 |
||||||||
82 |
48 |
||||||||
105 |
48 |
||||||||
83 |
49,5 |
||||||||
85 |
50 |
||||||||
123 |
55 |
||||||||
92,5 |
56 |
||||||||
170 |
56 |
||||||||
86,9 |
58,7 |
||||||||
118 |
59 |
||||||||
128 |
59,2 |
||||||||
200 |
60 |
||||||||
130,5 |
66 |
||||||||
280 |
85 |
||||||||
235 |
90 |
||||||||
227 |
91 |
||||||||
Исключаем d-централных наблюдений d=1/4*n = 1/4*40 = 10 |
|||||||||
Полученную совокупность нужно разделить на 2 части с малыми и большими значениями Х4 |
|||||||||
с малыми значениями |
с большими значениями |
||||||||
Y |
X4 |
Y |
X4 |
||||||
41 |
14 |
82 |
48 |
||||||
40 |
15 |
105 |
48 |
||||||
38 |
16 |
83 |
49,5 |
||||||
39 |
18 |
85 |
50 |
||||||
42 |
18 |
123 |
55 |
||||||
67 |
18,5 |
92,5 |
56 |
||||||
67 |
18,7 |
170 |
56 |
||||||
45 |
18,9 |
86,9 |
58,7 |
||||||
38 |
19 |
118 |
59 |
||||||
60 |
20 |
128 |
59,2 |
||||||
40 |
22 |
200 |
60 |
||||||
93 |
27,7 |
130,5 |
66 |
||||||
85 |
34 |
280 |
85 |
||||||
61,1 |
34,8 |
235 |
90 |
||||||
70,3 |
34,8 |
227 |
91 |
||||||
Для каждой из частей находим уравнение регрессии. |
|||||||||
выполняем следующие действия: сервис → анализ данных → регрессия |
|||||||||
ВЫВОД ИТОГОВ |
(с малыми значениями) |
||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,690 |
||||||||
R-квадрат |
0,476 |
||||||||
Нормированный |
0,436 |
||||||||
Стандартная |
13,727 |
||||||||
Наблюдения |
15 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
2227,560 |
2227,560 |
11,822 |
0,004 |
||||
Остаток |
13 |
2449,609 |
188,431 |
||||||
Итого |
14 |
4677,169 |
|||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
16,756 |
11,700 |
1,432 |
0,176 |
-8,520 |
42,032 |
|||
X4 |
1,746 |
0,508 |
3,438 |
0,004 |
0,649 |
2,843 |
|||
|
|||||||||
ВЫВОД ОСТАТКА |
|||||||||
Наблюдение |
Предска- |
Остатки |
|||||||
1 |
41,197 |
-0,197 |
|||||||
2 |
42,943 |
-2,943 |
|||||||
3 |
44,689 |
-6,689 |
|||||||
4 |
48,180 |
-9,180 |
|||||||
5 |
48,180 |
-6,180 |
|||||||
6 |
49,053 |
17,947 |
|||||||
7 |
49,402 |
17,598 |
|||||||
8 |
49,751 |
-4,751 |
|||||||
9 |
49,926 |
-11,926 |
|||||||
10 |
51,672 |
8,328 |
|||||||
11 |
55,163 |
-15,163 |
|||||||
12 |
65,114 |
27,886 |
|||||||
13 |
76,112 |
8,888 |
|||||||
14 |
77,509 |
-16,409 |
|||||||
15 |
77,509 |
-7,209 |
|||||||
ВЫВОД ИТОГОВ |
(с большими значениями) |
||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,867 |
||||||||
R-квадрат |
0,752 |
||||||||
Нормированный |
0,732 |
||||||||
Стандартная |
33,151 |
||||||||
Наблюдения |
15 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
43212,921 |
43212,921 |
39,321 |
0,000 |
||||
Остаток |
13 |
14286,735 |
1098,980 |
||||||
Итого |
14 |
57499,656 |
|||||||
Коэффи- |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
||||
Y-пересечение |
-92,022 |
38,454 |
-2,393 |
0,033 |
-175,097 |
-8,947 |
|||
X4 |
3,786 |
0,604 |
6,271 |
0,000 |
2,482 |
5,090 |
|||
ВЫВОД ОСТАТКА |
|||||||||
Наблюдение |
Предска- |
Остатки |
|||||||
1 |
89,703 |
-7,703 |
|||||||
2 |
89,703 |
15,297 |
|||||||
3 |
95,382 |
-12,382 |
|||||||
4 |
97,275 |
-12,275 |
|||||||
5 |
116,205 |
6,795 |
|||||||
6 |
119,991 |
-27,491 |
|||||||
7 |
119,991 |
50,009 |
|||||||
8 |
130,213 |
-43,313 |
|||||||
9 |
131,349 |
-13,349 |
|||||||
10 |
132,106 |
-4,106 |
|||||||
11 |
135,135 |
64,865 |
|||||||
12 |
157,850 |
-27,350 |
|||||||
13 |
229,783 |
50,217 |
|||||||
14 |
248,713 |
-13,713 |
|||||||
15 |
252,499 |
-25,499 |
|||||||
Для каждой из частей записываем уравнение регрессии: |
|||||||||
с малыми значенияvи |
Yрасч = 16,756 -1,746*Х4 |
||||||||
с большими значенияи |
Yрасч = -92,002 +3,786*Х4 |
||||||||
Для каждого уравнения регрессии находим остаточную сумму квадратов отклонений (из таблицы дисперсионный анализ) | |||||||||
с малыми значенияи |
S1у |
2449,609 |
|||||||
с большими значенияи |
S2у |
14286,735 |
|||||||
Применяем критерий Фишера: |
|||||||||
Так как S2у > S1у, то |
F расч = S2у/S1у = |
5,832 |
|||||||
Находим Fтабл (α, к1, к2) |
|||||||||
α = 0.05 |
|||||||||
к1 = n1-m=15-2=13 |
|||||||||
к2 = n-n1-m=40-15-2=23 |
|||||||||
где m = число оцениваемых параметров уравнения регрессии |
|||||||||
Fтабл = |
2,175 |
||||||||
Сравниваем F расч и F табл. |
|||||||||
5,832 > 2,175, следовательно имеет место гетероскедастичность. |
|||||||||
Остатки регрессии имеют не одинаковую дисперсию. |
|||||||||
Вывод: Модель считается качественной, если выполняются все предпосылки МНК. |
|||||||||
Данная модель некачественная, т.к. дисперсия остатков не одинакова для каждого значения Х4. |
|||||||||
5. Проверка точности модели |
|||||||||
а) Стандартная ошибка отклонения |
|||||||||
Syрасч = |
28,202 |
||||||||
б) Средний модуль остатков |
|||||||||
I Et I сред = Σ I Et I / n= |
862,593 /40 = |
21,565 |
|||||||
в) Средняя ошибка аппроксимации |
|||||||||
E отн.ср. = 1/n * ∑ IEt /Yt I * 100% |
|||||||||
E отн.ср. = 1/40 * 8,718 *100% = |
21,8 |
% |
|||||||
Так как Eотн.ср.> 7(10)%, то данная модель не является точной. |
|||||||||
6.Оценка влияния значимых
факторов на результат с | |||||||||
Коэффициент регрессии: |
а4 = |
2,476 |
|||||||
Коэффициент эластичности: |
|||||||||
Э yxj = (aj * Хjср) / Yср |
|||||||||
Эyx4=(2,476 *101,38) / 42,045 = |
5,96 |
% |
|||||||
Коэффициент эластичности показывает на сколько процентов изменяется в среднем значение зависимой переменной У, если фактор Х4 увеличить на 1 % | |||||||||
Т.е. при увеличении жилой площади квартиры на 1 %, цена квартиры увеличится в среднем на 5,96 %. |
|||||||||
β-коэффиент: |
|||||||||
βyxj = (aj * Sхj) / Sy, |
где |
||||||||
Sy - среднеквадратичное отклонение показателя Y |
|||||||||
Sy = √ ∑(Yj - Yjср)² / (n-1) = |
√ 1 767854,019 / (40-1)= |
212,907 |
|||||||
Sxj - среднеквадратичное отклонение фактора Хj |
|||||||||
Sxj = √ ∑(Хj - Хjср)² / (n-1) = |
Sx4 =√15 958,727 / (40-1)= |
20,229 |
|||||||
βyx4 = (2,476 *20,229) / 212,907 = |
0,235 |
(связь прямая) |
|||||||
Коэффициент β показывает на какую часть своего СКО изменяется в среднем значение показателя Y, если из факторов Х4 увеличить на величину своего СКО. | |||||||||
Т.е., если фактор Х4 увеличится на 20,229, то среднее значение показателя Y увеличится на (0,235*212,907)= | |||||||||
= |
50,086 |
||||||||
Δ-коэффициент: |
|||||||||
Δyxj = (ryxj * βyxj) / ∑(ryxj * βyxj) , где |
|||||||||
Δyx4 = (ryx4 * βyx4) / (ryx4 * βyx4) , где |
|||||||||
(применим данные из Задания 4) |
|||||||||
ryx4 = |
0,852 |
||||||||
Δyx4 = 1 |
|||||||||
Коэффициент Δ показывает долю влияния фактора в суммарном влиянии всех факторов. |
Задача 2 |
||||||
Исследовать динамику экономического показателя на основе анализа одномерного временного ряда. | ||||||
Исходные данные |
||||||
В течение девяти последовательных недель фиксировался спрос Y(t) (млн.руб.) на кредитные ресурсы финансовой комнапии. Временной ряд Y(t) этого показателя: | ||||||
Номер |
Спрос на кредитные ресурсы Y(t), млн.руб. |
|||||
1 |
30 |
|||||
2 |
28 |
|||||
3 |
33 |
|||||
4 |
37 |
|||||
5 |
40 |
|||||
6 |
42 |
|||||
7 |
44 |
|||||
8 |
49 |
|||||
9 |
47 |
|||||
Решение: |
||||||
Задание 1 |
||||||
Проверьте наличие аномальных наблюдений |
||||||
t |
Y(t) |
|||||
1 |
30 |
|||||
2 |
28 |
|||||
3 |
33 |
|||||
4 |
37 |
|||||
5 |
40 |
|||||
6 |
42 |
|||||
7 |
44 |
|||||
8 |
49 |
|||||
9 |
47 |