Модель линейной регрессии

Автор работы: Пользователь скрыл имя, 06 Февраля 2014 в 12:51, контрольная работа

Описание работы

1 этап: Оценка взаимосвязей. Строим матрицу парных коэффициентов корреляции: ...
Вывод: из матрицы видно, что с зависимой переменной (y) тесно связаны переменные: год выпуска автомобиля, объём багажника, тип кузова, КПП, объём двигателя, комплектация а/м, тип привода, техническое состояние а/м и максимальный расход топлива на 100км; такая переменная, как пробег автомобиля по России слабо связана с ценой автомобиля бизнес-класса.

Файлы: 1 файл

RGR__5.docx

— 123.32 Кб (Скачать файл)

  • Полученная на второй итерации модель имеет вид:

y = -60496,71+30,33х1 + 64,84х3 +  10,07х8 + 34,22х10

            (t=-7,81)          (t=7,82)        (t=2,64)      (t=0,66)          (t=4,33)

  • Вычислим tкр.= (0,05;50-5),где 5-оцененных параметров (4 независимых и 1 зависимая).

 

                               tкр.= 2,01

 

 

 

 

 

 

Оценка значимости коэффициентов  регрессии:

Коэффициент

t-статистика

Сравнение с tкр. = 2,01

Гипотеза Hо: bi= 0

Доверительный интервал

0 принадлежит или нет ДИ

Вывод о значимости

-60496,71

-7,81

>

нет

(-76111,15; -44882,28)

нет

значим

30,33

7,82

>

нет

(22,52; 38,15)

нет

значим

64,84

2,64

>

нет

(15,38; 114,29)

нет

значим

10,07

0,66

<

да

(-20,83; 40,96)

да

не значим

34,22

4,33

>

нет

(18,30; 50,13)

нет

значим


 

Вывод: на данной этапе мы имеем 4 значимых коэффициента регрессии из 5 с вероятностью 95%. При этом значении F-статистики выросло до 175,19,но значение коэффициента детерминации осталось на прежнем уровне R2=0,94.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4) Перейдём к построению  третьей модели:

  Для этого исключим из второй модели следующую переменную: Х8. Включаем из первой модели в нашу модель Х1, Х3, Х10, возвращаем следующие переменные: Х4 (т.к. ryx4 = 0,85 –высокий уровень), Х5 (т.к. ryx5 = 0,93–высокий уровень), Х6 (ryx6 = 0,83–высокий уровень), Х7 (ryx7 = 0,83–высокий уровень), Х9 (ryx9 = 0,85–высокий уровень).

3-я модель (исключаем Х8,возвращаем Х4, Х5, Х6, Х7,Х9): F=206,38, R2=0,98

Регрессионная статистика

         

Множественный R

0,99

         

R-квадрат

0,98

         

Нормированный R-квадрат

0,97

         

Стандартная ошибка

34,14

         

Наблюдения

50

         
             

Дисперсионный анализ

       
 

df

SS

MS

F

Значимость F

 

Регрессия

8,00

1924372,74

240546,59

206,38

0,00

 

Остаток

40,00

46622,89

1165,57

     

Итого

48,00

1970995,63

       
             
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-39991,58

6258,19

-6,39

0,00

-52639,85

-27343,30

х1

20,11

3,13

6,42

0,00

13,78

26,44

х3

-11,10

27,19

-0,41

0,69

-66,05

43,84

х4

-53,56

24,07

-2,23

0,03

-102,20

-4,91

х5

0,05

0,01

6,76

0,00

0,04

0,07

х6

9,89

28,77

0,34

0,73

-48,25

68,03

х7

15,93

28,72

0,55

0,58

-42,12

73,99

х9

124,61

40,61

3,07

0,00

42,53

206,69

х10

7,14

6,45

1,11

0,27

-5,90

20,18


  • Полученная на третьей итерации модель имеет вид:

y = -39991,58 + 20,11Х1 + (-11,10Х3) + (-53,56Х4) + 0,05Х5 + 9,89Х6 + 15,93Х7 + 124,61Х9 + 7,14Х10

               (t=-6,39)         (t=6,42)               (t=-0,41)               (t=-2,23)        (t=6,76)         (t=0,34)        (t=0,55)            (t=3,07)          (t=1,11)

 

 

  • Вычислим tкр. = (0,05; 50-9),где 9 – оцененных параметров (8 независимых и 1 зависимая).


 

                                         

                                 tкр. = 2,02         

 

 

 

 

 

Оценка значимости коэффициентов  регрессии:

Коэффициент

t-статистика

Сравнение с tкр. = 2,02

Гипотеза Hо: bi= 0

Доверительный интервал

0 принадлежит или нет ДИ

Вывод о значимости

-39991,58

-6,39

>

нет

(-52639,85; -27343,30)

нет

значим

20,11

6,42

>

нет

(13,78; 26,44)

нет

значим

-11,10

-0,41

<

да

(-66,05; 43,84)

да

не значим

-53,56

-2,23

>

нет

(-102,20; -4,91)

нет

значим

0,05

6,76

>

нет

(0,04; 0,07)

нет

значим

9,89

0,34

<

да

(-48,25;68,03)

да

не значим

15,93

0,55

<

да

(-42,12; 73,99)

да

не значим

124,61

        3,07

          >

нет

(42,53; 206,69)

нет

значим

7,14

1,11

<

да

(-5,90; 20,18)

да

не значим


 

Вывод: на данной этапе мы уже имеем 5 значимых коэффициентов регрессии из 9 с вероятностью 95%. Значение F-статистики выросло до 206,38, значение коэффициента детерминации осталось на прежнем уровне R2=0,98.

 

 

 

 

 

 

 

 

5) Перейдём к построению четвёртой модели:

   Для этого из третьей  модели исключим следующие переменные: Х6, Х7, Х10 (т.к. не значимые переменные). Включаем в модель: Х1459, возвращаем из первой модели Х2 (ryx2=0,80-высокий уровень), оставляем Х3 (посмотреть, как будет себя вести переменная в этой модели).

4-я модель (исключаем Х6, Х7, Х10, возвращаем Х2, Х3): F=278,99, R2=0,98

Регрессионная статистика

         

Множественный R

0,99

         

R-квадрат

0,98

         

Нормированный R-квадрат

0,97

         

Стандартная ошибка

33,89

         

Наблюдения

50

         
             

Дисперсионный анализ

       
 

df

SS

MS

F

Значимость F

 

Регрессия

6,00

1922752,20

320458,70

278,99

0,00

 

Остаток

42,00

48243,44

1148,65

     

Итого

48,00

1970995,63

       
             
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-40409,32

6376,46

-6,34

0,00

-53277,55

-27541,10

х1

20,32

3,19

6,37

0,00

13,88

26,76

х2

0,06

0,06

0,94

0,35

-0,07

0,18

х3

-12,10

26,97

-0,45

0,66

-66,53

42,33

х4

-59,46

23,10

-2,57

0,01

-106,07

-12,84

х5

0,05

0,01

8,05

0,00

0,04

0,07

х9

158,72

28,10

5,65

0,00

102,01

215,42


  • Полученная на четвёртой итерации модель имеет вид:

y = -40409,32 + 20,32Х1 + 0,06Х2 + (-12,10Х3) + (-59,46Х4) + 0,05Х5 + 158,72Х9

              (t=-6,34)              (t=6,37)       (t=0,94)           (t=-0,45)              (t=-2,57)          (t=8,05)           (t=5,65)

  • Вычислим tкр.=(0,05;50-7),где 7-оцененных параметров(6 независимых и 1 зависимая).

 

                                tкр.= 2,02

 

 

 

Оценка значимости коэффициентов  регрессии:

Коэффициент

t-статистика

Сравнение с tкр. = 2,02

Гипотеза Hо: bi= 0

Доверительный интервал

0 принадлежит или нет ДИ

Вывод о значимости

-40409,32

-6,34

>

нет

(-53277,55; -27541,10)

нет

значим

20,32

6,37

>

нет

(13,88; 26,76)

нет

значим

0,06

0,94

<

да

(-0,07; 0,18)

да

не значим

-12,10

-0,45

<

да

(-66,53; 42,33)

да

не значим

-59,46

-2,57

>

нет

(-106,07; -12,84)

нет

значим

0,05

8,05

>

нет

(0,04; 0,07)

нет

значим

158,72

5,65

>

нет

(102,01; 215,42)

нет

значим


 

Вывод: на данной этапе имеем 5 значимых коэффициентов регрессии из 7 с вероятностью 95%. Значение F-статистики выросло до 278,99, значение коэффициента детерминации осталось на прежнем уровне R2=0,98.

Информация о работе Модель линейной регрессии