Автор работы: Пользователь скрыл имя, 06 Февраля 2014 в 12:51, контрольная работа
1 этап: Оценка взаимосвязей. Строим матрицу парных коэффициентов корреляции: ...
Вывод: из матрицы видно, что с зависимой переменной (y) тесно связаны переменные: год выпуска автомобиля, объём багажника, тип кузова, КПП, объём двигателя, комплектация а/м, тип привода, техническое состояние а/м и максимальный расход топлива на 100км; такая переменная, как пробег автомобиля по России слабо связана с ценой автомобиля бизнес-класса.
Для этого из четвёртой модели исключим такие переменные, как Х2,Х3(т.к. не значимы). Включаем в модель переменные: Х1,Х4,Х5,Х9 и возвращаем Х10 из первой модели (посмотреть, как себя поведёт в этой модели и ryx10 = 0,90 –высокий уровень).
5-я модель (исключаем Х2,Х3,возвращаем Х10):F=346,26, R2=0,98
Регрессионная статистика |
||||||
Множественный R |
0,99 |
|||||
R-квадрат |
0,98 |
|||||
Нормированный R-квадрат |
0,97 |
|||||
Стандартная ошибка |
33,33 |
|||||
Наблюдения |
50 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
5,00 |
1923229,24 |
384645,85 |
346,26 |
0,00 |
|
Остаток |
43,00 |
47766,40 |
1110,85 |
|||
Итого |
48,00 |
1970995,63 |
||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пересечение |
-40674,51 |
6017,27 |
-6,76 |
0,00 |
-52809,49 |
-28539,52 |
х1 |
20,45 |
3,01 |
6,79 |
0,00 |
14,38 |
26,52 |
х4 |
-57,31 |
22,49 |
-2,55 |
0,01 |
-102,66 |
-11,95 |
х5 |
0,05 |
0,01 |
6,87 |
0,00 |
0,04 |
0,06 |
х9 |
141,15 |
24,63 |
5,73 |
0,00 |
91,49 |
190,82 |
х10 |
7,67 |
6,18 |
1,24 |
0,22 |
-4,80 |
20,15 |
y = -40674,51 + 20,45Х1 + (-57,31Х4) + 0,05Х5 + 141,15Х9 + 7,67Х10
(t=-6,76) (t=6,79) (t=-2,55) (t=6,87) (t=5,73) (t=1,24)
Оценка значимости коэффициентов регрессии:
Коэффициент |
t-статистика |
Сравнение с tкр. = 2,02 |
Гипотеза Hо: bi= 0 |
Доверительный интервал |
0 принадлежит или нет ДИ |
Вывод о значимости |
-40674,51 |
-6,76 |
> |
нет |
(-52809,49; -28539,52) |
нет |
значим |
20,45 |
6,79 |
> |
нет |
(14,38; 26,52) |
нет |
значим |
-57,31 |
-2,55 |
> |
нет |
(-102,66; -11,95) |
нет |
значим |
0,05 |
6,87 |
> |
нет |
(0,04; 0,06) |
нет |
значим |
141,15 |
5,73 |
> |
нет |
(91,49; 190,82) |
нет |
значим |
7,67 |
1,24 |
< |
да |
(-4,80; 20,15) |
да |
не значим |
Вывод: включение в модель переменную Х10 не принесло желаемый результатов (она оказалась не значимой), т.е. мы имеем 5 значимых коэффициентов регрессии из 6 с вероятностью 95%.
Значение F-статистики выросло до 346,26, значение коэффициента детерминации осталось на прежнем уровне R2=0,98.
Для этого из пятой модели исключим переменную Х10,так как не значима.
6-я модель (ИТОГ): F=427,20, R2=0,97
Регрессионная статистика |
||||||
Множественный R |
0,99 |
|||||
R-квадрат |
0,97 |
|||||
Нормированный R-квадрат |
0,97 |
|||||
Стандартная ошибка |
33,53 |
|||||
Наблюдения |
50 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
4,00 |
1921518,81 |
480379,70 |
427,20 |
0,00 |
|
Остаток |
44,00 |
49476,83 |
1124,47 |
|||
Итого |
48,00 |
1970995,63 |
||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пересечение |
-42432,61 |
5883,85 |
-7,21 |
0,00 |
-54290,73 |
-30574,49 |
х1 |
21,34 |
2,94 |
7,25 |
0,00 |
15,41 |
27,27 |
х4 |
-65,88 |
21,53 |
-3,06 |
0,00 |
-109,28 |
-22,48 |
х5 |
0,05 |
0,01 |
8,34 |
0,00 |
0,04 |
0,07 |
х9 |
155,56 |
21,85 |
7,12 |
0,00 |
111,52 |
199,60 |
y = -42432,61+21,34Х1 +(-65,88Х4) + 0,05Х5 +155,56Х9
(t=-7,21) (t=7,25) (t=-3,06) (t=8,34) (t=7,12)
Оценка значимости коэффициентов регрессии:
Коэффициент |
t-статистика |
Сравнение с tкр. = 2,01 |
Гипотеза Hо: bi= 0 |
Доверительный интервал |
0 принадлежит или нет ДИ |
Вывод о значимости |
-42432,61 |
-7,21 |
> |
нет |
(-54290,73; -30574,49) |
нет |
значим |
21,34 |
7,25 |
> |
нет |
(15,41; 27,27) |
нет |
значим |
-65,88 |
-3,06 |
> |
нет |
(-109,28; -22,48) |
нет |
значим |
0,05 |
8,34 |
> |
нет |
(0,04; 0,07) |
нет |
значим |
155,56 |
7,12 |
> |
нет |
(111,52; 199,60) |
нет |
значим |
Вывод: Все коэффициенты статистически значимы с вероятностью 95%. Полученная модель по критерию Фишера является пригодной (F=427,20; R2=0,97).
а) Все a, b1, b4, b5, b9 –статистически значимы;
б) Ho: b1=b4=b5=b9 =0 (гипотеза об отсутствии линейной функциональной связи).
Найдём Fкр.= F (α; k-1; n-k) = (0,05; 5-1; 50-5) => Fкр.= 2,58
Fо = 427,20 > 2,58 (Fкр.)
Вывод: Fо = 427,20 € d1, следовательно, гипотеза Но отклоняется, принимается гипотеза Н1,т.е. линейная функциональная связь между ценой автомобиля бизнес-класса и четырьмя независимыми переменными существует.
в) R2=97% - показывает, что изменение стоимости автомобилей бизнес-класса на 97% объясняется изменениями следующих переменных: годом выпуска а/м, коробкой переключения передач, объёмом двигателя и техническим состоянием автомобиля; при этом оставшиеся 3% приходятся на другие неучтённые моделью факторы, такие как: Х2,Х3,Х6,Х7,Х8,Х10.
Эi = * Ẍ =>
Э1= * 2007,6 = 63,2 %
Вывод: цена автомобиля бизнес-класса увеличится на 63,2%, если год выпуска увеличить на 1%.
Э5= * 4088 = 3,02%
Вывод: цена автомобиля бизнес-класса увеличится на 3,02%,если объём двигателя увеличить на 1%.
Рассчитаем цену на автомобиль бизнес-класса согласно следующим условиям:
Пусть: год выпуска автомобиля будет 2010 год (Х1); автомобиль с АКПП (Х4);
объём двигателя а/м =4000см3 (Х5) и автомобиль бизнес-класса будет с отличным (1) техническим состоянием (Х9).
y = -42432,61+ 21,34*2010 - 65,88*0 + 0,05*4000 + 155,56*1 = 816 350 рублей.
(t=-7,21) (t=7,25) (t=-3,06) (t=8,34) (t=7,12)