Парная линейная регрессия

Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 18:11, контрольная работа

Описание работы

Необходимо определить, какой из заданных показателей является зависимой переменной, а какой – независимой. Построить поле корреляции. Найти точечные и интервальные оценки параметров модели y = a + b*x. Оценить значимость коэффициентов регрессии, используя t-критерий Стьюдента и доверительные интервалы истинных значений параметров. Верифицировать полученную модель, используя дисперсионный анализ в регрессии и элементы теории корреляции. Интерпретировать полученные результаты. Сделать прогноз на основе модели.

Файлы: 1 файл

Ekonometricheskoe_modelirovanie.doc

— 308.00 Кб (Скачать файл)

Эконометрическое моделирование

Тема: Парная линейная регрессия

Лабораторная №1

 

Имеются исходные данные (12 наблюдений):

 

Кредиты, млн. руб.

8,2

8,5

9,1

9,5

10,1

11,2

12

13

14

15

 

 

16

 

 

17,4

Доходы населения, млн. руб.

11,3

14,8

15,6

16,5

16,4

17,8

17,1

16

18,7

18,7

 

 

19,7

 

 

27,9


 

Необходимо определить, какой из заданных показателей является зависимой  переменной, а какой – независимой. Построить поле корреляции. Найти  точечные и интервальные оценки параметров модели y = a + b*x. Оценить значимость коэффициентов регрессии, используя t-критерий Стьюдента и доверительные интервалы истинных значений параметров. Верифицировать полученную модель, используя дисперсионный анализ в регрессии и элементы теории корреляции. Интерпретировать полученные результаты. Сделать прогноз на основе модели.

Решение: 1 способ (ручной)

1 этап: Спецификация модели.

 

Определим, какой из заданных показателей  будет зависимой переменной, а  какой независимой. Так как труд является одним из факторов производства (экономическая теория), то доходы населения обозначим в качестве независимой переменной x, а кредиты- y.

Чтобы определить характер зависимости, построим поле корреляции:

 

Следующим шагом наносим на поле корреляции прямую :

 

Из графика видно, что точки  распределены практически однородно относительно прямой, поэтому можно сказать, что условие гомоскедастичности выполняется.

 

2 этап: Построение модели.

 

Найдем оценки параметров модели с помощью метода наименьших квадратов (МНК). Для этого составим вспомогательную таблицу:

 

 

 

№ наблюдения

 

 


 

 


 

 


 

 


 

 


1

11,3

8,2

127,69

67,24

92,66

2

14,8

8,5

219,04

72,25

125,8

3

15,6

9,1

243,36

82,81

141,96

4

16,5

9,5

272,25

90,25

156,75

5

16,4

10,1

268,96

102,01

165,64

6

17,8

11,2

316,84

125,44

199,36

7

17,1

12

292,41

144

205,2

8

16

13

256

169

208

9

18,7

14

349,69

196

261,8

10

18,7

15

349,69

225

280,5

11

19,7

16

388,09

256

315,2

12

27,9

17,4

778,41

302,76

485,46

Итого

210,5

144

3862,43

1832,76

2638,33


 

Оценки параметров модели находятся из условия:

 Тогда

 

Где 2038,91

Коэффициенты совпадают с уравнением на диаграмме.

Уравнение прямой линии примет вид: .

При этом уравнение модели напишем в виде: .

Для анализа полученной модели рассчитываем теоретические значения объясняемой  переменной: . Также найдем значение остатков и минимальное значение функции . Для этого составим вспомогательную таблицу:

 

№ наблюдения

 

 


 

 


 

 

1

8,2

7,8735224

0,326478

0,10658762

2

8,5

10,187435

-1,687435

2,84743823

3

9,1

10,71633

-1,61633

2,61252202

4

9,5

11,311336

-1,811336

3,2809381

5

10,1

11,245224

-1,145224

1,31153847

6

11,2

12,170789

-0,970789

0,94243206

7

12

11,708007

0,291993

0,08526003

8

13

10,980777

2,019223

4,07726152

9

14

12,765796

1,234204

1,5232605

10

15

12,765796

2,234204

4,9916693

11

16

13,426914

2,573086

6,62077362

12

17,4

18,848081

-1,448081

2,09693916

Итого

144

144

0

30,4966206


 

Остаточная сумма квадратов:

Вычислим несмещенные оценки дисперсий  и ковариаций оценок и :

5,777159

0,017949

-0,314851

Несмещенная оценка дисперсии ошибок наблюдений:

3,049662065

3 этап: Оценка значимости коэффициентов  регрессии.

Оценка значимости коэффициентов  регрессии при  с помощью:

а) доверительных интервалов истинных значений параметров.

Для нахождения интервальных оценок полученных коэффициентов регрессии  предварительно вычислим квантиль распределения  Стьюдента:

 

Доверительный интервал для параметра :

,

.

Доверительный интервал для параметра  :

,

Как мы видим, доверительный интервал для коэффициента регрессии   не содержит нулевых значений, значит, коэффициент считается статистически значимым, доверительный интервал для параметра содержит 0, соответственно, он считается незначимым.

б) t-критерий Стьюдента

Проверяем гипотезу против альтернативной гипотезы , используя при этом статистику

- наблюдаемое или экспериментальное значение t-статистики.

Критическая область двухсторонняя:

Гипотеза  отвергается с вероятностью 0,95, следовательно, принимается гипотеза так как , т. е. . Это означает, что параметр - незначим.

Проверяем гипотезу против альтернативной гипотезы , используя при этом статистику

- наблюдаемое или экспериментальное  значение t-статистики.

Критическая область двухсторонняя:

Гипотеза  отвергается с вероятностью 0,95, следовательно, принимается гипотеза так как , т. е. . Это означает, что параметр - значим.

4 этап: Верификация модели.

Пригодность построенной модели или ее верификация, а также качество оценивания регрессии может быть проверено двумя равноценными способами: дисперсионным анализом в регрессии и с использованием элементов теории корреляции.

 

а) Дисперсионный анализ в регрессии

 

Суть метода заключается в разложении общей суммарной дисперсии объема производства на составляющие, обусловленные  действием численности работников, и остаточную дисперсию, обусловленную  дисперсию, обусловленную ошибкой  или всеми неучтенными в данной модели переменными. Для проверки гипотезы о равенстве таких дисперсий используем критерий Фишера (F-критерий). Поскольку для оценок дисперсий используются суммы квадратов SS отклонений значений данной переменной от ее средней величины, то можно говорить о разложении общей суммы квадратов SSобщ. На составляющие. Сначала вычислим среднее значение зависимой переменной:

- средний объем производства  в течение наблюдаемого периода.  Для расчета сумм квадратов  составим вспомогательную таблицу:

 

№ наблюдения

1

17

16,55674413

59,29

66,31261623

2

14

17,14898092

114,49

57,0178892

3

26

22,47911203

1,69

4,932343356

4

27

27,80924315

5,29

9,667392978

5

27

33,13937427

5,29

71,22303807

6

35

35,50832143

106,09

116,8198122

7

18

18,3334545

44,89

40,53290163

8

22

21,29463845

7,29

11,59648727

9

49

44,98411009

590,49

411,445122

10

12

9,746021031

161,29

223,621487

Итого

247

247

1096,1

1013,16909


 

- величина, характеризующая разброс  значений  относительно среднего значения . Разобьем эту сумму на две части: объясненную регрессионным уравнением и необъясненную (т. е. связанную с ошибками ):

- сумма квадратов, объясненная  регрессией, 

- остаточная сумма квадратов,  обусловленная ошибкой.

Проверка: (верно).

Найдем коэффициент детерминации:

.

Значение коэффициента детерминации близко к 1. Это означает, что 92,43 % общей  вариации объема производства объясняется  численностью работников. При этом остальные 7,57 % приходятся на долю прочих факторов, не учтенных в уравнении  регрессии. К таким факторам можно отнести: объем основных и оборотных средств, спрос на продукцию, цену и т. д.

 

Использование элементов  теории корреляции

Другой способ верификации линейной модели состоит в использовании  элементов теории корреляции. Мерой  линейной связи двух величин является коэффициент корреляции:

Проверка    (верно).

Значение коэффициента корреляции говорит о том, что линейная связь  между численностью работников и  объемом производства очень тесная и прямая, т.е. рост численности работников приводит к увеличению объема производства.

Проверяем гипотезу об отсутствии линейной связи между  и с помощью критерия Стьюдента .

Критическая область двухсторонняя:

С вероятностью 0,95 гипотезу отвергаем, так как , т. е. 9,886 2,306

Это означает, что коэффициент корреляции статистически значим.

 

5 этап: Интерпретация полученных  показателей

 

Таким образом, коэффициент  является незначимым. Значение коэффициента регрессии говорит о том, что при увеличении численности работников на 1 человека, объем продукции увеличится на 0,592 млн. руб. или 592,2 тыс. рублей.

Найдем коэффициент эластичности для данной модели:

(полученное значение будет  сразу в процентах)

Значение коэффициента эластичности приближенно показывает, что значение величины объема производства изменится  на 1,096 % при изменении численности  работников на 1% от среднего значения.

 

6 этап: Прогноз на основе линейной модели

 

Точечный прогноз: .

Допустим, что прогнозное значение независимой переменной изменяется на от среднего, то найдем оптимистическое и пессимистическое значения и :

 чел.

 чел.

При этом объем продукции в оптимистическом  случае составит:

 млн. руб.,

в пессимистическом соответственно:

 млн. руб.

Интервальный прогноз значения :

.

Для нахождения дисперсии величины : составим вспомогательную таблицу:

 

№ наблюдения

1

32

189,0625

2

33

162,5625

3

42

14,0625

4

51

27,5625

5

60

203,0625

6

64

333,0625

7

35

115,5625

8

40

33,0625

9

80

1173,0625

10

20,5

637,5625

Итого

457,5

2888,625

Информация о работе Парная линейная регрессия