Модель линейной регрессии

Автор работы: Пользователь скрыл имя, 06 Февраля 2014 в 12:51, контрольная работа

Описание работы

1 этап: Оценка взаимосвязей. Строим матрицу парных коэффициентов корреляции: ...
Вывод: из матрицы видно, что с зависимой переменной (y) тесно связаны переменные: год выпуска автомобиля, объём багажника, тип кузова, КПП, объём двигателя, комплектация а/м, тип привода, техническое состояние а/м и максимальный расход топлива на 100км; такая переменная, как пробег автомобиля по России слабо связана с ценой автомобиля бизнес-класса.

Файлы: 1 файл

RGR__5.docx

— 123.32 Кб (Скачать файл)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    1. Перейдём к построению пятой модели:

  Для этого из четвёртой модели исключим такие переменные, как Х23(т.к. не значимы). Включаем в модель переменные: Х1459  и возвращаем Х10 из первой модели (посмотреть, как себя поведёт в этой модели и ryx10 = 0,90 –высокий уровень).

5-я модель (исключаем Х23,возвращаем Х10):F=346,26, R2=0,98

Регрессионная статистика

         

Множественный R

0,99

         

R-квадрат

0,98

         

Нормированный R-квадрат

0,97

         

Стандартная ошибка

33,33

         

Наблюдения

50

         
             

Дисперсионный анализ

       
 

df

SS

MS

F

Значимость F

 

Регрессия

5,00

1923229,24

384645,85

346,26

0,00

 

Остаток

43,00

47766,40

1110,85

     

Итого

48,00

1970995,63

       
             
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-40674,51

6017,27

-6,76

0,00

-52809,49

-28539,52

х1

20,45

3,01

6,79

0,00

14,38

26,52

х4

-57,31

22,49

-2,55

0,01

-102,66

-11,95

х5

0,05

0,01

6,87

0,00

0,04

0,06

х9

141,15

24,63

5,73

0,00

91,49

190,82

х10

7,67

6,18

1,24

0,22

-4,80

20,15


  • Полученная на пятой итерации модель имеет вид:

y = -40674,51 + 20,45Х1 + (-57,31Х4) + 0,05Х5 + 141,15Х9 + 7,67Х10

              (t=-6,76)       (t=6,79)          (t=-2,55)         (t=6,87)     (t=5,73)       (t=1,24)

 

 

 

 

  • Вычислим tкр. = (0,05; 50-6), где 6-оцененных параметров (5 независимых и 1 зависимая).

 

                                 tкр.= 2,02

 

 

 

 

 

 

Оценка значимости коэффициентов  регрессии:

Коэффициент

t-статистика

Сравнение с tкр. = 2,02

Гипотеза Hо: bi= 0

Доверительный интервал

0 принадлежит или нет ДИ

Вывод о значимости

-40674,51

-6,76

>

нет

(-52809,49; -28539,52)

нет

значим

20,45

6,79

>

нет

(14,38; 26,52)

нет

значим

-57,31

-2,55

>

нет

(-102,66; -11,95)

нет

значим

0,05

6,87

>

нет

(0,04; 0,06)

нет

значим

141,15

5,73

>

нет

(91,49; 190,82)

нет

значим

7,67

1,24

<

да

(-4,80; 20,15)

да

не значим


 

Вывод: включение в модель переменную Х10 не принесло желаемый результатов (она оказалась не значимой), т.е. мы имеем 5 значимых коэффициентов регрессии из 6 с вероятностью 95%.

Значение F-статистики выросло до 346,26, значение коэффициента детерминации осталось на прежнем уровне R2=0,98.

 

 

 

 

 

 

 

 

    1. Перейдём к построению шестой модели:

 Для этого из пятой модели  исключим переменную Х10,так как не значима.

6-я модель (ИТОГ): F=427,20, R2=0,97

Регрессионная статистика

         

Множественный R

0,99

         

R-квадрат

0,97

         

Нормированный R-квадрат

0,97

         

Стандартная ошибка

33,53

         

Наблюдения

50

         
             

Дисперсионный анализ

       
 

df

SS

MS

F

Значимость F

 

Регрессия

4,00

1921518,81

480379,70

427,20

0,00

 

Остаток

44,00

49476,83

1124,47

     

Итого

48,00

1970995,63

       
             
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-42432,61

5883,85

-7,21

0,00

-54290,73

-30574,49

х1

21,34

2,94

7,25

0,00

15,41

27,27

х4

-65,88

21,53

-3,06

0,00

-109,28

-22,48

х5

0,05

0,01

8,34

0,00

0,04

0,07

х9

155,56

21,85

7,12

0,00

111,52

199,60


  • Полученная на шестой итерации модель имеет вид:

y =  -42432,61+21,34Х1 +(-65,88Х4) + 0,05Х5 +155,56Х9

               (t=-7,21)       (t=7,25)         (t=-3,06)          (t=8,34)     (t=7,12)

  • Вычислим tкр.=(0,05;50-5),где 5-оцененных параметров (4 независимых и 1 зависимая).

                                    tкр.= 2,01

 

 

 

 

Оценка значимости коэффициентов  регрессии:

Коэффициент

t-статистика

Сравнение с tкр. = 2,01

Гипотеза Hо: bi= 0

Доверительный интервал

0 принадлежит или нет ДИ

Вывод о значимости

-42432,61

-7,21

>

нет

(-54290,73; -30574,49)

нет

значим

21,34

7,25

>

нет

(15,41; 27,27)

нет

значим

-65,88

-3,06

>

нет

(-109,28; -22,48)

нет

значим

0,05

8,34

>

нет

(0,04; 0,07)

нет

значим

155,56

7,12

>

нет

(111,52; 199,60)

нет

значим


 

Вывод: Все коэффициенты статистически значимы с вероятностью 95%. Полученная модель по критерию Фишера является пригодной (F=427,20; R2=0,97).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    1. Интерпретация коэффициентов регрессии:(a-свободный коэффициент, b1,b4,b5,b9).

а) Все a, b1, b4, b5, b9 –статистически значимы;

б) Ho: b1=b4=b5=b9 =0 (гипотеза об отсутствии линейной функциональной связи).

Найдём Fкр.= F (α; k-1; n-k) = (0,05; 5-1; 50-5) => Fкр.= 2,58

Fо = 427,20 > 2,58 (Fкр.)

 

 

 

 

Вывод: Fо = 427,20  € d1, следовательно, гипотеза Но отклоняется, принимается гипотеза Н1,т.е. линейная функциональная связь между ценой автомобиля бизнес-класса и четырьмя независимыми переменными существует.

в) R2=97% - показывает, что изменение стоимости автомобилей бизнес-класса на 97% объясняется изменениями следующих переменных: годом выпуска а/м, коробкой переключения передач, объёмом двигателя и техническим состоянием автомобиля; при этом оставшиеся 3% приходятся на другие неучтённые моделью факторы, такие как: Х2367810.

 

  •  a (свободный коэф.)=-42432,61тыс.р.=>-42432610руб.–показывает, что, если независимые переменные будут =0,то цена на автомобиль бизнес-класса будет снижена на 42432610 руб.

 

  • b1=21,34тыс.р. => 21340р. – показывает, что, если год выпуска автомобиля бизнес-класса увеличить на 1 год, то её цена вырастит на 21 340 руб.

 

  • b4=-65,88 тыс.р. => -65 880р. – означает, что, если у автомобиля бизнес-класса будет МКПП, то её цена на такой автомобиль будет дешевле на 65 880р., по сравнению с АКПП.

 

  • b5=0,05 тыс.р. => 50р. – показывает, что, если объём двигателя автомобиля увеличить на 1см3, то цена на такой автомобиль будет дороже на 50р.

 

  • b9=155,56 тыс.р.=>155 560р. – показывает, что, если у автомобиля будет отличное техническое состояние, то она будет дороже на 155 560р.

 

 

 

 

  • Рассчитаем коэффициент частной эластичности:

Эi = * Ẍ  =>

 

Э1=   * 2007,6 = 63,2 %

Вывод: цена автомобиля бизнес-класса увеличится на 63,2%, если год выпуска увеличить на 1%.

                 Э5= * 4088 = 3,02%

Вывод: цена автомобиля бизнес-класса увеличится на 3,02%,если объём двигателя увеличить на 1%.

    1. Точечный прогноз:

Рассчитаем цену на автомобиль бизнес-класса согласно следующим условиям:

Пусть: год выпуска автомобиля будет 2010 год (Х1); автомобиль с АКПП (Х4);

объём двигателя а/м =4000см3 5) и автомобиль бизнес-класса будет с отличным (1) техническим состоянием (Х9).

 

 

y = -42432,61+ 21,34*2010 - 65,88*0 + 0,05*4000 + 155,56*1 = 816 350 рублей.

              (t=-7,21)         (t=7,25)                  (t=-3,06)         (t=8,34)                     (t=7,12)

Информация о работе Модель линейной регрессии