Автор работы: Пользователь скрыл имя, 09 Февраля 2013 в 03:57, лабораторная работа
По территориям региона приводятся данные за 199Х г.
Лабораторная работа 2
По территориям региона приводятся данные за 199Х г.
| Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х | Среднедневная заработная плата, руб., у | 
| 1 | 78+N | 133+N | 
| 2 | 82-N | 148+N | 
| 3 | 87+N | 134-N | 
| 4 | 79-N | 154-N | 
| 5 | 89+N | 162+N | 
| 6 | 106-N | 195+N | 
| 7 | 67+N | 139-N | 
| 8 | 88-N | 158-N | 
| 9 | 73+N | 152+N | 
| 10 | 87-N | 162+N | 
| 11 | 76+N | 159-N | 
| 12 | 115-N | 173-N | 
Требуется:
1. Построить 
линейное уравнение парной 
2. Рассчитать 
линейный коэффициент парной 
корреляции, среднюю ошибку аппроксимации.                
3. Оценить статистическую 
значимость уравнения в целом 
и параметров регрессии и 
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Решение
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу
| № | х | y | ух | x2 | y2 | ||||
| 1 | 78 | 133 | 10374 | 6084 | 17689 | 149 | -16 | 256 | 12,0 | 
| 2 | 82 | 148 | 12136 | 6724 | 21904 | 152 | -4 | 16 | 2,7 | 
| 3 | 87 | 134 | 11658 | 7569 | 17956 | 157 | -23 | 529 | 17,2 | 
| 4 | 79 | 154 | 12166 | 6241 | 23716 | 150 | 4 | 16 | 2,6 | 
| 5 | 89 | 162 | 14418 | 7921 | 26244 | 159 | 3 | 9 | 1,9 | 
| 6 | 106 | 195 | 20670 | 11236 | 38025 | 174 | 21 | 441 | 10,8 | 
| 7 | 67 | 139 | 9313 | 4489 | 19321 | 139 | 0 | 0 | 0,0 | 
| 8 | 88 | 158 | 13904 | 7744 | 24964 | 158 | 0 | 0 | 0,0 | 
| 9 | 73 | 152 | 11096 | 5329 | 23104 | 144 | 8 | 64 | 5,3 | 
| 10 | 87 | 162 | 14094 | 7569 | 26244 | 157 | 5 | 25 | 3,1 | 
| 11 | 76 | 159 | 12084 | 5776 | 25281 | 147 | 12 | 144 | 7,5 | 
| 12 | 115 | 173 | 19895 | 13225 | 29929 | 183 | -10 | 100 | 5,8 | 
| Итого | 1027 | 1869 | 161808 | 89907 | 294377 | 1869 | 0 | 1600 | 68,9 | 
| Среднее значение | 85,6 | 155,8 | 13484,0 | 7492,3 | 24531,4 | 5,7 | |||
| 12,84 | 16,05 | ||||||||
| 164,94 | 257,76 | 
Получено уравнение регрессии: . С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х - среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как А не превышает 8 - 10%.
3.Рассчитаем F- критерий.
, .
-гипотеза о статистической незначимости уравнения регрессии отклоняется .
 Оценку статистической 
значимости параметров 
Выдвигаем гипотезу H0 о статистически незначимом отличии показателей от нуля:
tтабл для числа степеней свободы и составит 2,23.
Определим случайные ошибки :
Тогда
Фактические значения t-статистики превосходят табличные значения:
поэтому гипотеза H0 отклоняется, т.е. a, b и не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительный интервал для а и b. Для этого определим предельную ошибку для каждого показателя:
Доверительные интервалы:
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры а и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: тыс. руб. тогда прогнозное значение среднедневной заработной платы составит:
тыс. руб.
5. Ошибка прогноза составит:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза:
руб.;
руб.
2 способ.
При выполнении лабораторной работы можно использовать программу Excel (Сервис, Анализ данных, Регрессия).
В результате получим таблицу вида
Таблица 1
| Регрессионная статистика | |||||||||
| Множественный R | 0,721025214 | ||||||||
| R-квадрат | 0,519877359 | ||||||||
| Нормированный R-квадрат | 0,471865095 | ||||||||
| Стандартная ошибка | 12,5495908 | ||||||||
| Наблюдения | 12 | ||||||||
| 
 Таблица 2 | |||||||||
| Дисперсионный анализ | |||||||||
| 
 | df | SS | MS | F | Значимость F | ||||
| Регрессия | 1 | 1705,327706 | 1705,327706 | 10,82801173 | 0,008141843 | ||||
| Остаток | 10 | 1574,922294 | 157,4922294 | ||||||
| Итого | 11 | 3280,25 | |||||||
| 
 Таблица 3 | |||||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | ||||
| Y-пересечение | 76,9764852 | 24,21156138 | 3,179327594 | 0,009830668 | 23,02976485 | 130,9232056 | |||
| Переменная X 1 | 0,920430553 | 0,279715587 | 3,290594434 | 0,008141843 | 0,297185389 | 1,543675716 | |||
| ВЫВОД ОСТАТКА | |||||||||
| 
 Таблица 4 | |||||||||
| Наблюдение | Предсказанное Y | Остатки | |||||||
| 1 | 148,7700683 | -15,77006831 | |||||||
| 2 | 152,4517905 | -4,45179052 | |||||||
| 3 | 157,0539433 | -23,05394328 | |||||||
| 4 | 149,6904989 | 4,309501138 | |||||||
| 5 | 158,8948044 | 3,105195612 | |||||||
| 6 | 174,5421238 | 20,45787622 | |||||||
| 7 | 138,6453322 | 0,354667771 | |||||||
| 8 | 157,9743738 | 0,025626164 | |||||||
| 9 | 144,1679155 | 7,832084455 | |||||||
| 10 | 157,0539433 | 4,946056717 | |||||||
| 11 | 146,9292072 | 12,0707928 | |||||||
| 12 | 182,8259988 | -9,825998758 | |||||||
В использование таблицы Вам поможет цветовая схема
Пункт 1. Параметры линейного уравнения парной регрессии y от x расположены в таблице 3.
Пункт 2.   Коэффициент 
корреляции находится в таблице 
1. Для нахождения средней ошибки 
аппроксимации можно использова
Пункт 3. Фактическое значение F-критерия находится в таблице 2, а t-статистика – в таблице 3.
Пункт 4. Прогнозное значение подсчитывается подстановкой интересуемого значения x в уравнение регрессии.
Пункт 5. Значение Sост , используемое в формуле для подсчета ошибки прогноза расположено в таблице 1.