Автор работы: Пользователь скрыл имя, 11 Декабря 2013 в 08:49, контрольная работа
1) Рассчитайте корреляцию между экономическими показателями (не менее 6) из статистических данных по выборке не менее 50 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
1) Рассчитайте корреляцию между экономическими показателями
2) Постройте линейную множественную регрессию
3) Проверка модели на отсутствие автокорреляции
4) Проверка на гетероскедастичность моделей
Список литературы
Содержание
|
3 |
2) Постройте линейную множественную регрессию |
6 |
3) Проверка модели на отсутствие автокорреляции |
10 |
4) Проверка на гетероскедастичность моделей |
13 |
Список литературы |
17 |
Имеются исходные выборочные данные по организациям одной из отраслей хозяйствования в 2011 году (выборка 20%-ная, бесповторная) о результатах производственной деятельности организаций:
Среднегодовая стоимость ОПФ (у) |
Среднесписочная численность работников (х1) |
Выпуск продукции (х2) |
Уровень производительности труда (х3) |
Фондоотдача (х4) |
Товарооборот (х5) |
Издержки(х6) |
34,714 |
162 |
36,45 |
0,225 |
1,05 |
6 |
3,5 |
24,375 |
156 |
23,4 |
0,15 |
0,96 |
9,2 |
7,5 |
41,554 |
179 |
46,54 |
0,26 |
1,12 |
11,4 |
5,3 |
50,212 |
194 |
59,752 |
0,308 |
1,19 |
9,3 |
2,9 |
38,347 |
165 |
41,415 |
0,251 |
1,08 |
8,4 |
3,2 |
27,408 |
158 |
26,86 |
0,17 |
0,98 |
5,7 |
2,1 |
60,923 |
220 |
79,2 |
0,36 |
1,3 |
8,2 |
4 |
47,172 |
190 |
54,72 |
0,288 |
1,16 |
6,3 |
2,5 |
37,957 |
163 |
40,424 |
0,248 |
1,065 |
8,2 |
3,2 |
30,21 |
159 |
30,21 |
0,19 |
1 |
5,6 |
3 |
38,562 |
167 |
42,418 |
0,254 |
1,1 |
11 |
5,4 |
52,5 |
205 |
64,575 |
0,315 |
1,23 |
6,5 |
3,2 |
45,674 |
187 |
51,612 |
0,276 |
1,13 |
8,9 |
6,5 |
34,388 |
161 |
35,42 |
0,22 |
1,03 |
11,5 |
5,5 |
16 |
120 |
14,4 |
0,12 |
0,9 |
4,2 |
8,2 |
34,845 |
162 |
36,936 |
0,228 |
1,06 |
6 |
3,5 |
46,428 |
188 |
53,392 |
0,284 |
1,15 |
9,2 |
7,5 |
38,318 |
164 |
41 |
0,25 |
1,07 |
11,4 |
5,3 |
47,59 |
192 |
55,68 |
0,29 |
1,17 |
9,3 |
2,9 |
19,362 |
130 |
18,2 |
0,14 |
0,94 |
8,4 |
3,2 |
31,176 |
159 |
31,8 |
0,2 |
1,02 |
5,7 |
2,1 |
36,985 |
162 |
39,204 |
0,242 |
1,06 |
8,2 |
4 |
48,414 |
193 |
57,128 |
0,296 |
1,18 |
6,3 |
2,5 |
28,727 |
158 |
28,44 |
0,18 |
0,99 |
8,2 |
3,2 |
39,404 |
168 |
43,344 |
0,258 |
1,1 |
5,6 |
3 |
55,25 |
208 |
70,72 |
0,34 |
1,28 |
11 |
5,4 |
38,378 |
166 |
41,832 |
0,252 |
1,09 |
6,5 |
3,2 |
55,476 |
207 |
69,345 |
0,335 |
1,25 |
8,9 |
6,5 |
34,522 |
161 |
35,903 |
0,223 |
1,04 |
11,5 |
5,5 |
44,839 |
186 |
50,22 |
0,27 |
1,12 |
4,2 |
8,2 |
47,172 |
190 |
54,72 |
0,288 |
1,16 |
6 |
3,5 |
37,957 |
163 |
40,424 |
0,248 |
1,065 |
9,2 |
7,5 |
30,21 |
159 |
30,21 |
0,19 |
1 |
11,4 |
5,3 |
38,562 |
167 |
42,418 |
0,254 |
1,1 |
9,3 |
2,9 |
52,5 |
205 |
64,575 |
0,315 |
1,23 |
8,4 |
3,2 |
45,674 |
187 |
51,612 |
0,276 |
1,13 |
5,7 |
2,1 |
34,388 |
161 |
35,42 |
0,22 |
1,03 |
8,2 |
4 |
28,727 |
158 |
28,44 |
0,18 |
0,99 |
6,3 |
2,5 |
39,404 |
168 |
43,344 |
0,258 |
1,1 |
8,2 |
3,2 |
55,25 |
208 |
70,72 |
0,34 |
1,28 |
5,6 |
3 |
38,378 |
166 |
41,832 |
0,252 |
1,09 |
11 |
5,4 |
34,845 |
162 |
36,936 |
0,228 |
1,06 |
6,5 |
3,2 |
46,428 |
188 |
53,392 |
0,284 |
1,15 |
8,9 |
6,5 |
52,5 |
205 |
64,575 |
0,315 |
1,23 |
11,5 |
5,5 |
45,674 |
187 |
51,612 |
0,276 |
1,13 |
4,2 |
8,2 |
45,674 |
187 |
51,612 |
0,276 |
1,13 |
5,7 |
2,1 |
47,172 |
190 |
54,72 |
0,288 |
1,16 |
6 |
3,5 |
37,957 |
163 |
40,424 |
0,248 |
1,065 |
9,2 |
7,5 |
38,378 |
166 |
41,832 |
0,252 |
1,09 |
6,5 |
3,2 |
55,476 |
207 |
69,345 |
0,335 |
1,25 |
8,9 |
6,5 |
Корреляционная зависимость рентабельности от различных факторов.
Матрица парных коэффициентов корреляции.
- |
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
y |
1 |
0.98 |
0.99 |
0.99 |
0.99 |
0.0885 |
0.00111 |
x1 |
0.98 |
1 |
0.98 |
0.94 |
0.97 |
0.0591 |
-0.0172 |
x2 |
0.99 |
0.98 |
1 |
0.98 |
1 |
0.0851 |
0.00481 |
x3 |
0.99 |
0.94 |
0.98 |
1 |
0.98 |
0.12 |
-0.00662 |
x4 |
0.99 |
0.97 |
1 |
0.98 |
1 |
0.0986 |
-0.0239 |
x5 |
0.0885 |
0.0591 |
0.0851 |
0.12 |
0.0986 |
1 |
0.28 |
x6 |
0.00111 |
-0.0172 |
0.00481 |
-0.00662 |
-0.0239 |
0.28 |
1 |
Анализ первой строки этой матрицы позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых ryxi < 0.5 исключают из модели.
На основании полученных данных можно сделать вывод, что наибольшее влияние на среднегодовую стоимость ОПФ оказывает фактор х1, х2, х3 - выпуск продукции, уровень производительности труда, фондоотдача, у остальных факторов наблюдается более слабый корреляционный отклик.
2) Постройте линейную множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.
Для выбора наилучшей
регрессионной функции
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,999882 |
|||||||
R-квадрат |
0,999764 |
|||||||
Нормированный R-квадрат |
0,999731 |
|||||||
Стандартная ошибка |
0,158894 |
|||||||
Наблюдения |
50 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
6 |
4595,634 |
765,9389 |
30337,32 |
2,8E-76 |
|||
Остаток |
43 |
1,085639 |
0,025247 |
|||||
Итого |
49 |
4596,719 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
14,84234 |
2,747508 |
5,40211 |
2,69E-06 |
9,301464 |
20,38322 |
9,301464 |
20,38322 |
Переменная X 1 |
0,149711 |
0,006274 |
23,8632 |
1,97E-26 |
0,137059 |
0,162363 |
0,137059 |
0,162363 |
Переменная X 2 |
0,256717 |
0,02661 |
9,647455 |
2,54E-12 |
0,203053 |
0,31038 |
0,203053 |
0,31038 |
Переменная X 3 |
123,7516 |
2,824853 |
43,80816 |
2,59E-37 |
118,0547 |
129,4485 |
118,0547 |
129,4485 |
Переменная X 4 |
-39,4818 |
2,971514 |
-13,2868 |
8,03E-17 |
-45,4744 |
-33,4891 |
-45,4744 |
-33,4891 |
Переменная X 5 |
-0,02412 |
0,011528 |
-2,09247 |
0,042335 |
-0,04737 |
-0,00087 |
-0,04737 |
-0,00087 |
Переменная X 6 |
0,009836 |
0,014009 |
0,702119 |
0,486388 |
-0,01842 |
0,038088 |
-0,01842 |
0,038088 |
Для парной регрессии Множественный R равен коэффициенту корреляции (rxу). Множественный коэффициент корреляции R определяется как коэффициент корреляции между наблюдаемыми значениями Yi и расчетными, прогнозируемыми значениями. По его значению 0,999882 можно сказать, что между X и Y существует сильная линейная зависимость.
Коэффициент корреляции в квадрате близок к 1, это означает, что данная модель хорошо описывает данные.
Получили уравнение регрессии:
Y = 14.84 + 0.15X1 + 0.26X2 + 123.75X3-39.48X4-0.0241X5 + 0.00984X6
Коэффициент b1=0,15 показывает, что при увеличении среднесписочной численность работников, среднегодовая стоимость ОПФ увеличивается в среднем на 0,15, увеличение выпуска продукции на 1%, приводит в среднем увеличению среднегодовой стоимости ОПФ на 0,26, увеличение производительности труда на 1% приводит к уменьшению среднегодовой стоимости ОПФ на 123,75, а уменьшение фондоотдачи, на 1% ведет к уменьшению рентабельности на 39,48. Увеличение товарооборота, на 1% ведет к уменьшению среднегодовой стоимости ОПФ на 0,0241. Увеличение издержек, на 1% ведет к увеличению среднегодовой стоимости ОПФ на 0,00984.
Стандартные ошибки mi, t-статистики ti могут быть вычислены по формулам: Si
Где σY - среднее квадратическое отклонение для отклика Y, σXi - среднее квадратическое отклонение для регрессора Xi (X1, X2, …)R2- коэффициент детерминации для уравнения множественной регрессии, - коэффициент детерминации для зависимости отклика Y от всех регрессоров кроме Xi, - коэффициент детерминации для зависимости Xi от всех регрессоров кроме Xi.
Tтабл (n-m-1;α) = (43;0.025) = 2.009
Находим стандартную ошибку коэффициента регрессии b0:
Статистическая значимость коэффициента регрессии b0 подтверждается.
Находим стандартную ошибку коэффициента регрессии b1:
Статистическая значимость коэффициента регрессии b1 подтверждается.
Находим стандартную ошибку коэффициента регрессии b2:
Статистическая значимость коэффициента регрессии b2 подтверждается.
Находим стандартную ошибку коэффициента регрессии b3:
Статистическая значимость коэффициента регрессии b3 подтверждается.
Находим стандартную ошибку коэффициента регрессии b4:
Статистическая значимость коэффициента регрессии b4 подтверждается.
Находим стандартную ошибку коэффициента регрессии b5:
Статистическая значимость коэффициента регрессии b5 не подтверждается.
Находим стандартную ошибку коэффициента регрессии b6:
Статистическая значимость коэффициента регрессии b6 не подтверждается.
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные
интервалы коэффициентов
(bi - ti Sbi; bi + ti Sbi)
b0: (14.84 - 2.009 • 6.9; 14.84 + 2.009 • 6.9) = (0.98;28.69)
b1: (0.15 - 2.009 • 0.0157; 0.15 + 2.009 • 0.0157) = (0.12;0.18)
b2: (0.26 - 2.009 • 0.0668; 0.26 + 2.009 • 0.0668) = (0.12;0.39)
b3: (123.75 - 2.009 • 7.09; 123.75 + 2.009 • 7.09) = (109.51;138)
b4: (-39.48 - 2.009 • 7.46; -39.48 + 2.009 • 7.46) = (-54.46;-24.49)
b5: (-0.0241 - 2.009 • 0.0289; -0.0241 + 2.009 • 0.0289) = (-0.0823;0.034)
b6: (0.00984 - 2.009 • 0.0352; 0.00984 + 2.009 • 0.0352) = (-0.0608;0.0805)
Табличное значение
t–критерия Стьюдента при
По величине Р-значения возможно определять значимость коэффициентов, не находя критическое значение t-статистики. Если значение t-статистики велико, то соответствующее значение вероятности значимости мало – меньше 0,05, и можно считать, что коэффициент регрессии значим. И наоборот, если значение t-статистики мало, соответственно вероятность значимости больше 0,05 – коэффициент считается незначимым.
Для коэффициентов b0, b2, b3, b4 значения вероятности близко к нулю, следовательно, b1 можно считать значимым, b1- близко к единице, коэффициент не значим.
Оценка значимости
уравнения множественной
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости α (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.