Автор работы: Пользователь скрыл имя, 06 Февраля 2014 в 12:51, контрольная работа
1 этап: Оценка взаимосвязей. Строим матрицу парных коэффициентов корреляции: ...
Вывод: из матрицы видно, что с зависимой переменной (y) тесно связаны переменные: год выпуска автомобиля, объём багажника, тип кузова, КПП, объём двигателя, комплектация а/м, тип привода, техническое состояние а/м и максимальный расход топлива на 100км; такая переменная, как пробег автомобиля по России слабо связана с ценой автомобиля бизнес-класса.
y = -60496,71+30,33х1 + 64,84х3 + 10,07х8 + 34,22х10
(t=-7,81) (t=7,82) (t=2,64) (t=0,66) (t=4,33)
tкр.= 2,01
Оценка значимости коэффициентов регрессии:
Коэффициент |
t-статистика |
Сравнение с tкр. = 2,01 |
Гипотеза Hо: bi= 0 |
Доверительный интервал |
0 принадлежит или нет ДИ |
Вывод о значимости | ||
-60496,71 |
-7,81 |
> |
нет |
(-76111,15; -44882,28) |
нет |
значим | ||
30,33 |
7,82 |
> |
нет |
(22,52; 38,15) |
нет |
значим | ||
64,84 |
2,64 |
> |
нет |
(15,38; 114,29) |
нет |
значим | ||
10,07 |
0,66 |
< |
да |
(-20,83; 40,96) |
да |
не значим | ||
34,22 |
4,33 |
> |
нет |
(18,30; 50,13) |
нет |
значим |
Вывод: на данной этапе мы имеем 4 значимых коэффициента регрессии из 5 с вероятностью 95%. При этом значении F-статистики выросло до 175,19,но значение коэффициента детерминации осталось на прежнем уровне R2=0,94.
4) Перейдём к построению третьей модели:
Для этого исключим из второй модели следующую переменную: Х8. Включаем из первой модели в нашу модель Х1, Х3, Х10, возвращаем следующие переменные: Х4 (т.к. ryx4 = 0,85 –высокий уровень), Х5 (т.к. ryx5 = 0,93–высокий уровень), Х6 (ryx6 = 0,83–высокий уровень), Х7 (ryx7 = 0,83–высокий уровень), Х9 (ryx9 = 0,85–высокий уровень).
3-я модель (исключаем Х8,возвращаем Х4, Х5, Х6, Х7,Х9): F=206,38, R2=0,98
Регрессионная статистика |
||||||
Множественный R |
0,99 |
|||||
R-квадрат |
0,98 |
|||||
Нормированный R-квадрат |
0,97 |
|||||
Стандартная ошибка |
34,14 |
|||||
Наблюдения |
50 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
8,00 |
1924372,74 |
240546,59 |
206,38 |
0,00 |
|
Остаток |
40,00 |
46622,89 |
1165,57 |
|||
Итого |
48,00 |
1970995,63 |
||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пересечение |
-39991,58 |
6258,19 |
-6,39 |
0,00 |
-52639,85 |
-27343,30 |
х1 |
20,11 |
3,13 |
6,42 |
0,00 |
13,78 |
26,44 |
х3 |
-11,10 |
27,19 |
-0,41 |
0,69 |
-66,05 |
43,84 |
х4 |
-53,56 |
24,07 |
-2,23 |
0,03 |
-102,20 |
-4,91 |
х5 |
0,05 |
0,01 |
6,76 |
0,00 |
0,04 |
0,07 |
х6 |
9,89 |
28,77 |
0,34 |
0,73 |
-48,25 |
68,03 |
х7 |
15,93 |
28,72 |
0,55 |
0,58 |
-42,12 |
73,99 |
х9 |
124,61 |
40,61 |
3,07 |
0,00 |
42,53 |
206,69 |
х10 |
7,14 |
6,45 |
1,11 |
0,27 |
-5,90 |
20,18 |
y = -39991,58 + 20,11Х1 + (-11,10Х3) + (-53,56Х4) + 0,05Х5 + 9,89Х6 + 15,93Х7 + 124,61Х9 + 7,14Х10
(t=-6,39) (t=6,42) (t=-0,41) (t=-2,23) (t=6,76) (t=0,34) (t=0,55) (t=3,07) (t=1,11)
tкр. = 2,02
Оценка значимости коэффициентов регрессии:
Коэффициент |
t-статистика |
Сравнение с tкр. = 2,02 |
Гипотеза Hо: bi= 0 |
Доверительный интервал |
0 принадлежит или нет ДИ |
Вывод о значимости | |
-39991,58 |
-6,39 |
> |
нет |
(-52639,85; -27343,30) |
нет |
значим | |
20,11 |
6,42 |
> |
нет |
(13,78; 26,44) |
нет |
значим | |
-11,10 |
-0,41 |
< |
да |
(-66,05; 43,84) |
да |
не значим | |
-53,56 |
-2,23 |
> |
нет |
(-102,20; -4,91) |
нет |
значим | |
0,05 |
6,76 |
> |
нет |
(0,04; 0,07) |
нет |
значим | |
9,89 |
0,34 |
< |
да |
(-48,25;68,03) |
да |
не значим | |
15,93 |
0,55 |
< |
да |
(-42,12; 73,99) |
да |
не значим | |
124,61 |
3,07 |
> |
нет |
(42,53; 206,69) |
нет |
значим | |
7,14 |
1,11 |
< |
да |
(-5,90; 20,18) |
да |
не значим |
Вывод: на данной этапе мы уже имеем 5 значимых коэффициентов регрессии из 9 с вероятностью 95%. Значение F-статистики выросло до 206,38, значение коэффициента детерминации осталось на прежнем уровне R2=0,98.
5) Перейдём к построению четвёртой модели:
Для этого из третьей
модели исключим следующие
4-я модель (исключаем Х6, Х7, Х10, возвращаем Х2, Х3): F=278,99, R2=0,98
Регрессионная статистика |
||||||
Множественный R |
0,99 |
|||||
R-квадрат |
0,98 |
|||||
Нормированный R-квадрат |
0,97 |
|||||
Стандартная ошибка |
33,89 |
|||||
Наблюдения |
50 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
6,00 |
1922752,20 |
320458,70 |
278,99 |
0,00 |
|
Остаток |
42,00 |
48243,44 |
1148,65 |
|||
Итого |
48,00 |
1970995,63 |
||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пересечение |
-40409,32 |
6376,46 |
-6,34 |
0,00 |
-53277,55 |
-27541,10 |
х1 |
20,32 |
3,19 |
6,37 |
0,00 |
13,88 |
26,76 |
х2 |
0,06 |
0,06 |
0,94 |
0,35 |
-0,07 |
0,18 |
х3 |
-12,10 |
26,97 |
-0,45 |
0,66 |
-66,53 |
42,33 |
х4 |
-59,46 |
23,10 |
-2,57 |
0,01 |
-106,07 |
-12,84 |
х5 |
0,05 |
0,01 |
8,05 |
0,00 |
0,04 |
0,07 |
х9 |
158,72 |
28,10 |
5,65 |
0,00 |
102,01 |
215,42 |
y = -40409,32 + 20,32Х1 + 0,06Х2 + (-12,10Х3) + (-59,46Х4) + 0,05Х5 + 158,72Х9
(t=-6,34) (t=6,37) (t=0,94) (t=-0,45) (t=-2,57) (t=8,05) (t=5,65)
tкр.= 2,02
Оценка значимости коэффициентов регрессии:
Коэффициент |
t-статистика |
Сравнение с tкр. = 2,02 |
Гипотеза Hо: bi= 0 |
Доверительный интервал |
0 принадлежит или нет ДИ |
Вывод о значимости |
-40409,32 |
-6,34 |
> |
нет |
(-53277,55; -27541,10) |
нет |
значим |
20,32 |
6,37 |
> |
нет |
(13,88; 26,76) |
нет |
значим |
0,06 |
0,94 |
< |
да |
(-0,07; 0,18) |
да |
не значим |
-12,10 |
-0,45 |
< |
да |
(-66,53; 42,33) |
да |
не значим |
-59,46 |
-2,57 |
> |
нет |
(-106,07; -12,84) |
нет |
значим |
0,05 |
8,05 |
> |
нет |
(0,04; 0,07) |
нет |
значим |
158,72 |
5,65 |
> |
нет |
(102,01; 215,42) |
нет |
значим |
Вывод: на данной этапе имеем 5 значимых коэффициентов регрессии из 7 с вероятностью 95%. Значение F-статистики выросло до 278,99, значение коэффициента детерминации осталось на прежнем уровне R2=0,98.