Автор работы: Пользователь скрыл имя, 09 Февраля 2013 в 03:57, лабораторная работа
По территориям региона приводятся данные за 199Х г.
Лабораторная работа 2
По территориям региона приводятся данные за 199Х г.
Номер региона |
Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х |
Среднедневная заработная плата, руб., у |
1 |
78+N |
133+N |
2 |
82-N |
148+N |
3 |
87+N |
134-N |
4 |
79-N |
154-N |
5 |
89+N |
162+N |
6 |
106-N |
195+N |
7 |
67+N |
139-N |
8 |
88-N |
158-N |
9 |
73+N |
152+N |
10 |
87-N |
162+N |
11 |
76+N |
159-N |
12 |
115-N |
173-N |
Требуется:
1. Построить
линейное уравнение парной
2. Рассчитать
линейный коэффициент парной
корреляции, среднюю ошибку аппроксимации.
3. Оценить статистическую
значимость уравнения в целом
и параметров регрессии и
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Решение
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу
№ |
х |
y |
ух |
x2 |
y2 |
||||
1 |
78 |
133 |
10374 |
6084 |
17689 |
149 |
-16 |
256 |
12,0 |
2 |
82 |
148 |
12136 |
6724 |
21904 |
152 |
-4 |
16 |
2,7 |
3 |
87 |
134 |
11658 |
7569 |
17956 |
157 |
-23 |
529 |
17,2 |
4 |
79 |
154 |
12166 |
6241 |
23716 |
150 |
4 |
16 |
2,6 |
5 |
89 |
162 |
14418 |
7921 |
26244 |
159 |
3 |
9 |
1,9 |
6 |
106 |
195 |
20670 |
11236 |
38025 |
174 |
21 |
441 |
10,8 |
7 |
67 |
139 |
9313 |
4489 |
19321 |
139 |
0 |
0 |
0,0 |
8 |
88 |
158 |
13904 |
7744 |
24964 |
158 |
0 |
0 |
0,0 |
9 |
73 |
152 |
11096 |
5329 |
23104 |
144 |
8 |
64 |
5,3 |
10 |
87 |
162 |
14094 |
7569 |
26244 |
157 |
5 |
25 |
3,1 |
11 |
76 |
159 |
12084 |
5776 |
25281 |
147 |
12 |
144 |
7,5 |
12 |
115 |
173 |
19895 |
13225 |
29929 |
183 |
-10 |
100 |
5,8 |
Итого |
1027 |
1869 |
161808 |
89907 |
294377 |
1869 |
0 |
1600 |
68,9 |
Среднее значение |
85,6 |
155,8 |
13484,0 |
7492,3 |
24531,4 |
5,7 | |||
12,84 |
16,05 |
||||||||
164,94 |
257,76 |
Получено уравнение регрессии: . С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х - среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как А не превышает 8 - 10%.
3.Рассчитаем F- критерий.
, .
-гипотеза о статистической незначимости уравнения регрессии отклоняется .
Оценку статистической
значимости параметров
Выдвигаем гипотезу H0 о статистически незначимом отличии показателей от нуля:
tтабл для числа степеней свободы и составит 2,23.
Определим случайные ошибки :
Тогда
Фактические значения t-статистики превосходят табличные значения:
поэтому гипотеза H0 отклоняется, т.е. a, b и не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительный интервал для а и b. Для этого определим предельную ошибку для каждого показателя:
Доверительные интервалы:
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры а и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: тыс. руб. тогда прогнозное значение среднедневной заработной платы составит:
тыс. руб.
5. Ошибка прогноза составит:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза:
руб.;
руб.
2 способ.
При выполнении лабораторной работы можно использовать программу Excel (Сервис, Анализ данных, Регрессия).
В результате получим таблицу вида
Таблица 1
Регрессионная статистика |
|||||||||
Множественный R |
0,721025214 |
||||||||
R-квадрат |
0,519877359 |
||||||||
Нормированный R-квадрат |
0,471865095 |
||||||||
Стандартная ошибка |
12,5495908 |
||||||||
Наблюдения |
12 |
||||||||
Таблица 2 |
|||||||||
Дисперсионный анализ |
|||||||||
|
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
1 |
1705,327706 |
1705,327706 |
10,82801173 |
0,008141843 |
||||
Остаток |
10 |
1574,922294 |
157,4922294 |
||||||
Итого |
11 |
3280,25 |
|||||||
Таблица 3 |
|||||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | ||||
Y-пересечение |
76,9764852 |
24,21156138 |
3,179327594 |
0,009830668 |
23,02976485 |
130,9232056 | |||
Переменная X 1 |
0,920430553 |
0,279715587 |
3,290594434 |
0,008141843 |
0,297185389 |
1,543675716 | |||
ВЫВОД ОСТАТКА |
|||||||||
Таблица 4 |
|||||||||
Наблюдение |
Предсказанное Y |
Остатки | |||||||
1 |
148,7700683 |
-15,77006831 | |||||||
2 |
152,4517905 |
-4,45179052 | |||||||
3 |
157,0539433 |
-23,05394328 | |||||||
4 |
149,6904989 |
4,309501138 | |||||||
5 |
158,8948044 |
3,105195612 | |||||||
6 |
174,5421238 |
20,45787622 | |||||||
7 |
138,6453322 |
0,354667771 | |||||||
8 |
157,9743738 |
0,025626164 | |||||||
9 |
144,1679155 |
7,832084455 | |||||||
10 |
157,0539433 |
4,946056717 | |||||||
11 |
146,9292072 |
12,0707928 | |||||||
12 |
182,8259988 |
-9,825998758 |
В использование таблицы Вам поможет цветовая схема
Пункт 1. Параметры линейного уравнения парной регрессии y от x расположены в таблице 3.
Пункт 2. Коэффициент
корреляции находится в таблице
1. Для нахождения средней ошибки
аппроксимации можно использова
Пункт 3. Фактическое значение F-критерия находится в таблице 2, а t-статистика – в таблице 3.
Пункт 4. Прогнозное значение подсчитывается подстановкой интересуемого значения x в уравнение регрессии.
Пункт 5. Значение Sост , используемое в формуле для подсчета ошибки прогноза расположено в таблице 1.