Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 18:11, контрольная работа
Необходимо определить, какой из заданных показателей является зависимой переменной, а какой – независимой. Построить поле корреляции. Найти точечные и интервальные оценки параметров модели y = a + b*x. Оценить значимость коэффициентов регрессии, используя t-критерий Стьюдента и доверительные интервалы истинных значений параметров. Верифицировать полученную модель, используя дисперсионный анализ в регрессии и элементы теории корреляции. Интерпретировать полученные результаты. Сделать прогноз на основе модели.
Имеются исходные данные (12 наблюдений):
Кредиты, млн. руб. |
8,2 |
8,5 |
9,1 |
9,5 |
10,1 |
11,2 |
12 |
13 |
14 |
15 |
16 |
17,4 |
Доходы населения, млн. руб. |
11,3 |
14,8 |
15,6 |
16,5 |
16,4 |
17,8 |
17,1 |
16 |
18,7 |
18,7 |
19,7 |
27,9 |
Необходимо определить, какой из заданных показателей является зависимой переменной, а какой – независимой. Построить поле корреляции. Найти точечные и интервальные оценки параметров модели y = a + b*x. Оценить значимость коэффициентов регрессии, используя t-критерий Стьюдента и доверительные интервалы истинных значений параметров. Верифицировать полученную модель, используя дисперсионный анализ в регрессии и элементы теории корреляции. Интерпретировать полученные результаты. Сделать прогноз на основе модели.
1 этап: Спецификация модели.
Определим, какой из заданных показателей будет зависимой переменной, а какой независимой. Так как труд является одним из факторов производства (экономическая теория), то доходы населения обозначим в качестве независимой переменной x, а кредиты- y.
Чтобы определить характер зависимости, построим поле корреляции:
Следующим шагом наносим на поле корреляции прямую :
Из графика видно, что точки распределены практически однородно относительно прямой, поэтому можно сказать, что условие гомоскедастичности выполняется.
2 этап: Построение модели.
Найдем оценки параметров модели с помощью метода наименьших квадратов (МНК). Для этого составим вспомогательную таблицу:
№ наблюдения |
|
|
|
|
| |||||
1 |
11,3 |
8,2 |
127,69 |
67,24 |
92,66 | |||||
2 |
14,8 |
8,5 |
219,04 |
72,25 |
125,8 | |||||
3 |
15,6 |
9,1 |
243,36 |
82,81 |
141,96 | |||||
4 |
16,5 |
9,5 |
272,25 |
90,25 |
156,75 | |||||
5 |
16,4 |
10,1 |
268,96 |
102,01 |
165,64 | |||||
6 |
17,8 |
11,2 |
316,84 |
125,44 |
199,36 | |||||
7 |
17,1 |
12 |
292,41 |
144 |
205,2 | |||||
8 |
16 |
13 |
256 |
169 |
208 | |||||
9 |
18,7 |
14 |
349,69 |
196 |
261,8 | |||||
10 |
18,7 |
15 |
349,69 |
225 |
280,5 | |||||
11 |
19,7 |
16 |
388,09 |
256 |
315,2 | |||||
12 |
27,9 |
17,4 |
778,41 |
302,76 |
485,46 | |||||
Итого |
210,5 |
144 |
3862,43 |
1832,76 |
2638,33 |
Оценки параметров модели находятся из условия:
Тогда
Где 2038,91
Коэффициенты совпадают с
Уравнение прямой линии примет вид: .
При этом уравнение модели напишем в виде: .
Для анализа полученной модели рассчитываем теоретические значения объясняемой переменной: . Также найдем значение остатков и минимальное значение функции . Для этого составим вспомогательную таблицу:
№ наблюдения |
|
|
|
| ||
1 |
8,2 |
7,8735224 |
0,326478 |
0,10658762 | ||
2 |
8,5 |
10,187435 |
-1,687435 |
2,84743823 | ||
3 |
9,1 |
10,71633 |
-1,61633 |
2,61252202 | ||
4 |
9,5 |
11,311336 |
-1,811336 |
3,2809381 | ||
5 |
10,1 |
11,245224 |
-1,145224 |
1,31153847 | ||
6 |
11,2 |
12,170789 |
-0,970789 |
0,94243206 | ||
7 |
12 |
11,708007 |
0,291993 |
0,08526003 | ||
8 |
13 |
10,980777 |
2,019223 |
4,07726152 | ||
9 |
14 |
12,765796 |
1,234204 |
1,5232605 | ||
10 |
15 |
12,765796 |
2,234204 |
4,9916693 | ||
11 |
16 |
13,426914 |
2,573086 |
6,62077362 | ||
12 |
17,4 |
18,848081 |
-1,448081 |
2,09693916 | ||
Итого |
144 |
144 |
0 |
30,4966206 |
Остаточная сумма квадратов:
Вычислим несмещенные оценки дисперсий и ковариаций оценок и :
5,777159
0,017949
-0,314851
Несмещенная оценка дисперсии ошибок наблюдений:
3,049662065
3 этап: Оценка значимости
Оценка значимости коэффициентов регрессии при с помощью:
а) доверительных интервалов истинных значений параметров.
Для нахождения интервальных оценок полученных коэффициентов регрессии предварительно вычислим квантиль распределения Стьюдента:
Доверительный интервал для параметра :
,
.
Доверительный интервал для параметра :
,
Как мы видим, доверительный интервал для коэффициента регрессии не содержит нулевых значений, значит, коэффициент считается статистически значимым, доверительный интервал для параметра содержит 0, соответственно, он считается незначимым.
б) t-критерий Стьюдента
Проверяем гипотезу против альтернативной гипотезы , используя при этом статистику
- наблюдаемое или экспериментальное значение t-статистики.
Критическая область двухсторонняя:
Гипотеза отвергается с вероятностью 0,95, следовательно, принимается гипотеза так как , т. е. . Это означает, что параметр - незначим.
Проверяем гипотезу против альтернативной гипотезы , используя при этом статистику
- наблюдаемое или
Критическая область двухсторонняя:
Гипотеза отвергается с вероятностью 0,95, следовательно, принимается гипотеза так как , т. е. . Это означает, что параметр - значим.
4 этап: Верификация модели.
Пригодность построенной модели или ее верификация, а также качество оценивания регрессии может быть проверено двумя равноценными способами: дисперсионным анализом в регрессии и с использованием элементов теории корреляции.
а) Дисперсионный анализ в регрессии
Суть метода заключается в разложении
общей суммарной дисперсии
- средний объем производства
в течение наблюдаемого
№ наблюдения |
||||
1 |
17 |
16,55674413 |
59,29 |
66,31261623 |
2 |
14 |
17,14898092 |
114,49 |
57,0178892 |
3 |
26 |
22,47911203 |
1,69 |
4,932343356 |
4 |
27 |
27,80924315 |
5,29 |
9,667392978 |
5 |
27 |
33,13937427 |
5,29 |
71,22303807 |
6 |
35 |
35,50832143 |
106,09 |
116,8198122 |
7 |
18 |
18,3334545 |
44,89 |
40,53290163 |
8 |
22 |
21,29463845 |
7,29 |
11,59648727 |
9 |
49 |
44,98411009 |
590,49 |
411,445122 |
10 |
12 |
9,746021031 |
161,29 |
223,621487 |
Итого |
247 |
247 |
1096,1 |
1013,16909 |
- величина, характеризующая разброс значений относительно среднего значения . Разобьем эту сумму на две части: объясненную регрессионным уравнением и необъясненную (т. е. связанную с ошибками ):
- сумма квадратов, объясненная регрессией,
- остаточная сумма квадратов, обусловленная ошибкой.
Проверка: (верно).
Найдем коэффициент
.
Значение коэффициента детерминации близко к 1. Это означает, что 92,43 % общей вариации объема производства объясняется численностью работников. При этом остальные 7,57 % приходятся на долю прочих факторов, не учтенных в уравнении регрессии. К таким факторам можно отнести: объем основных и оборотных средств, спрос на продукцию, цену и т. д.
Использование элементов теории корреляции
Другой способ верификации линейной модели состоит в использовании элементов теории корреляции. Мерой линейной связи двух величин является коэффициент корреляции:
Проверка (верно).
Значение коэффициента корреляции говорит о том, что линейная связь между численностью работников и объемом производства очень тесная и прямая, т.е. рост численности работников приводит к увеличению объема производства.
Проверяем гипотезу об отсутствии линейной связи между и с помощью критерия Стьюдента .
Критическая область двухсторонняя:
С вероятностью 0,95 гипотезу отвергаем, так как , т. е. 9,886 2,306
Это означает, что коэффициент корреляции статистически значим.
5 этап: Интерпретация полученных показателей
Таким образом, коэффициент является незначимым. Значение коэффициента регрессии говорит о том, что при увеличении численности работников на 1 человека, объем продукции увеличится на 0,592 млн. руб. или 592,2 тыс. рублей.
Найдем коэффициент
(полученное значение будет сразу в процентах)
Значение коэффициента эластичности приближенно показывает, что значение величины объема производства изменится на 1,096 % при изменении численности работников на 1% от среднего значения.
6 этап: Прогноз на основе линейной модели
Точечный прогноз: .
Допустим, что прогнозное значение независимой переменной изменяется на от среднего, то найдем оптимистическое и пессимистическое значения и :
чел.
чел.
При этом объем продукции в
млн. руб.,
в пессимистическом соответственно:
млн. руб.
Интервальный прогноз значения :
.
Для нахождения дисперсии величины : составим вспомогательную таблицу:
№ наблюдения |
||
1 |
32 |
189,0625 |
2 |
33 |
162,5625 |
3 |
42 |
14,0625 |
4 |
51 |
27,5625 |
5 |
60 |
203,0625 |
6 |
64 |
333,0625 |
7 |
35 |
115,5625 |
8 |
40 |
33,0625 |
9 |
80 |
1173,0625 |
10 |
20,5 |
637,5625 |
Итого |
457,5 |
2888,625 |