Автор работы: Пользователь скрыл имя, 02 Мая 2015 в 22:22, контрольная работа
ЗАДАЧА 1
Имеются данные, характеризующие выручку (у, млн. руб.) предприятия «АВС» в зависимости от капиталовложений (х, млн. руб.) за последние 10 лет.
1. Построить поле корреляции.
2. Найти параметры уравнения линейной регрессии ; дать экономическую интерпретацию параметров а и b.
3. Составить уравнения нелинейных регрессий:
• гиперболической ;
• степной ;
• показательной
4. Для каждой из моделей:
найти коэффициент парной корреляции (для нелинейных регрессий – индекс корреляции);
найти коэффициент детерминации;
проверить значимость уравнения регрессии в целом с помощью F – критерия Фишера;
найти среднюю относительную ошибку аппроксимации.
5. Составить сводную таблицу вычислений; выбрать лучшую модель; дать интерпретацию рассчитанных характеристик.
6. По лучшей модели составить прогноз на следующие два года показателя у (выручка), если х (объем капиталовложений) увеличивается на 10% по сравнению с последним годом.
7. Построить графики уравнений регрессии; отметить точки прогноза.
Задача 1 3
Задача 2 22
Литература 42
Оценка параметров уравнения регрессии.
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1
S2 = 49;8 = 0613
S2 = 0,613 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 0613 = 078
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии),
Sa – стандартное отклонение случайной величины a,
Sa = S ∑x2;n Sx
Sa = 078 00225;10 • 000233 = 505
Sb – стандартное отклонение случайной величины b,
Sb = S;n Sx
Sb = 078; 10 • 000233 = 10641
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика. Критерий Стьюдента.
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = –23863;10641 = 224
Поскольку 2.24 < 2.306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa
ta = 671;505 = 1329
Поскольку 13.29 > 2.306, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 49;799 = 03866
F = R2;1 – R2n – m –1;m
F = 03866;1 – 0386610–1–1;1 = 504
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 504 = 225
Степенное уравнение регрессии имеет вид y = a·xb
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = a xb + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
После линеаризации получим: ln(y) = ln(a) + b ln(x)
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
ln(x) |
ln(y) |
ln(x)2 |
ln(y)2 |
ln(x) • ln(y) |
3 |
4,04 |
9 |
16,3 |
12,12 |
3,01 |
4,02 |
9,06 |
16,19 |
12,11 |
3,02 |
4,01 |
9,09 |
16,04 |
12,08 |
3,01 |
3,99 |
9,03 |
15,9 |
11,98 |
3,03 |
4,01 |
9,15 |
16,07 |
12,13 |
3,04 |
4,02 |
9,24 |
16,17 |
12,23 |
3,05 |
4,02 |
9,3 |
16,19 |
12,27 |
3,08 |
4,03 |
9,5 |
16,2 |
12,41 |
3,15 |
4,04 |
9,94 |
16,33 |
12,74 |
3,13 |
4,04 |
9,78 |
16,32 |
12,63 |
30,51 |
40,21 |
93,1 |
161,72 |
122,69 |
Для наших данных система уравнений имеет вид
10a + 30,51 b = 40,21
30,51 a + 93,1 b = 122,69
Решаем систему и получаем: b = 0,1989, a = 3,4147
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e3,41467381x0,1989 = 30,40703x0,1989
Линия регрессии
Выборочные средние.
x = ∑xi;n = 3051;10 = 305
y = ∑yi;n = 4021;10 = 402
xy = ∑xiyi;n = 12269;10 = 1227
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 931;10 – 3052 = 000253
S2y = ∑y2i;n – y2 = 16172;10 – 4022 = 0000259
Среднеквадратическое отклонение
Sx = S2x = 000253 = 00503
Sy = S2y = 0000259 = 00161
Эмпирическое корреляционное отношение.
η = ∑y – yx2; ∑yi – y2
η = 311;799 = 0624
где
y – yx2 = 799 – 488 = 311
Индекс корреляции,
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
R = 1 – ∑yi – yx2; ∑yi – y2 ; R = 1 – 488;799 = 062
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 - ∑yi - yx2; ∑yi - y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации.
R2 = 1 – ∑yi – yx2; ∑yi – y2 ; R2 = 1– 488;799 = 0389
т.е. в 38.93 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 61,07 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу:
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,23 |
0,83 |
2,16 |
20,3 |
55,9 |
55,34 |
0,0121 |
0,32 |
20,4 |
54,9 |
55,39 |
0,79 |
0,24 |
20,2 |
53,9 |
55,28 |
3,57 |
1,92 |
20,6 |
55,1 |
55,5 |
0,48 |
0,16 |
20,9 |
55,8 |
55,66 |
0,0001 |
0,0196 |
21,1 |
55,9 |
55,77 |
0,0121 |
0,0181 |
21,8 |
56 |
56,13 |
0,0441 |
0,0166 |
23,4 |
56,9 |
56,92 |
1,23 |
0,000624 |
22,8 |
56,8 |
56,63 |
1,02 |
0,0283 |
211,6 |
557,9 |
557,86 |
7,99 |
4,88 |
Оценка параметров уравнения регрессии.
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1
S2 = 488;8 = 061
S2 = 0,61 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 061 = 078
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии),
Sa – стандартное отклонение случайной величины a,
Sa = S ∑x2;n Sx
Sa = 078 931;10 • 00503 = 1498
Sb – стандартное отклонение случайной величины b,
Sb = S;n Sx
Sb = 078; 10 • 00503 = 491
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика. Критерий Стьюдента.
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = 02;491 = 00405
Поскольку 0,0405 < 2,306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa ; ta = 341;1498 = 023
Поскольку 0.23 < 2.306, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 488;799 = 03893
F = R2;1 – R2n – m –1;m
F = 03893;1 – 0389310–1–1;1 = 51
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 51 = 226
Показательное уравнение регрессии имеет вид y = a·bx
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = a bx + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
После линеаризации получим: ln(y) = ln(a) + x ln(b)
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
x |
ln(y) |
x2 |
ln(y)2 |
x • ln(y) |
20,1 |
4,04 |
404,01 |
16,3 |
81,16 |
20,3 |
4,02 |
412,09 |
16,19 |
81,68 |
20,4 |
4,01 |
416,16 |
16,04 |
81,71 |
20,2 |
3,99 |
408,04 |
15,9 |
80,54 |
20,6 |
4,01 |
424,36 |
16,07 |
82,59 |
20,9 |
4,02 |
436,81 |
16,17 |
84,06 |
21,1 |
4,02 |
445,21 |
16,19 |
84,9 |
21,8 |
4,03 |
475,24 |
16,2 |
87,75 |
23,4 |
4,04 |
547,56 |
16,33 |
94,57 |
22,8 |
4,04 |
519,84 |
16,32 |
92,1 |
211,6 |
40,21 |
4489,32 |
161,72 |
851,05 |
Для наших данных система уравнений имеет вид
10a + 211,6 b = 40,21
211,6 a + 4489,32 b = 851,05
Решаем уравнение и получаем: b = 0,00921, a = 3,8267
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e3,82665604·e0,00921x = 45,90876·1,00925x
Линия регрессии
Выборочные средние.
x = ∑xi;n = 2116;10 = 2116
y = ∑yi;n = 4021;10 = 402
xy = ∑xiyi;n = 85105;10 = 8511
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 448932;10 – 21162 = 119
S2y = ∑y2i;n – y2 = 16172;10 – 4022 = 0000259
Среднеквадратическое отклонение
Sx = S2x = 119 = 1089
Sy = S2y = 0000259 = 00161
Эмпирическое корреляционное отношение.
η = ∑y – yx2; ∑yi – y2
η = 3124;799 = 0625
где
y – yx2 = 799 – 486 = 3124
Индекс корреляции.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
R = 1 – ∑yi – yx2; ∑yi – y2 ; R = 1 – 486;799 = 063
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 – ∑yi – yx2; ∑yi – y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации.
R2 = 1 – ∑yi – yx2; ∑yi – y2 ; R2 = 1– 486;799 = 0391
т,е, в 39,11 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 60,89 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу:
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,24 |
0,83 |
2,13 |
20,3 |
55,9 |
55,34 |
0,0121 |
0,31 |
20,4 |
54,9 |
55,39 |
0,79 |
0,24 |
20,2 |
53,9 |
55,29 |
3,57 |
1,94 |
20,6 |
55,1 |
55,5 |
0,48 |
0,16 |
20,9 |
55,8 |
55,65 |
0,0001 |
0,0227 |
21,1 |
55,9 |
55,75 |
0,0121 |
0,0219 |
21,8 |
56 |
56,11 |
0,0441 |
0,0126 |
23,4 |
56,9 |
56,95 |
1,23 |
0,00204 |
22,8 |
56,8 |
56,63 |
1,02 |
0,0284 |
211,6 |
557,9 |
557,86 |
7,99 |
4,86 |
Оценка параметров уравнения регрессии.
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1
S2 = 486;8 = 0608
S2 = 0.608 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 0.608 = 0.78
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии),
Sa – стандартное отклонение случайной величины a,
Sa = S ∑x2;n Sx
Sa = 078 448932;10 • 1089 = 48
Sb – стандартное отклонение случайной величины b.
Sb = S;n Sx
Sb = 078; 10 • 1089 = 023
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика. Критерий Стьюдента.
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = 000921;023 = 00407
Поскольку 0,0407 < 2,306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa
ta = 383;48 = 08
Поскольку 0,8 < 2,306, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 486;799 = 03911
F = R2;1 – R2n – m –1;m
F = 03911;1 – 0391110–1–1;1 = 514
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 514 = 227
Параметры |
Модель | |||
линейная |
гиперболическая |
степенная |
показательная | |
y = 0,513 x + 44,9353 |
y = –238,6259 / x + 67,0958 |
y = e3,41467381x0,1989 = 30,40703x0,1989 |
y = e3,82665604·e0,00921x = 45,90876·1,00925x | |
Ryx |
0,625 |
0,62 |
0,62 |
0,63 |
Ryx2 |
0,3908 |
0,387 |
0,389 |
0,391 |
Fрасч |
5,13 |
5,1 |
5,1 |
5,14 |