Автор работы: Пользователь скрыл имя, 02 Мая 2015 в 22:22, контрольная работа
ЗАДАЧА 1
Имеются данные, характеризующие выручку (у, млн. руб.) предприятия «АВС» в зависимости от капиталовложений (х, млн. руб.) за последние 10 лет.
1. Построить поле корреляции.
2. Найти параметры уравнения линейной регрессии ; дать экономическую интерпретацию параметров а и b.
3. Составить уравнения нелинейных регрессий:
• гиперболической ;
• степной ;
• показательной
4. Для каждой из моделей:
найти коэффициент парной корреляции (для нелинейных регрессий – индекс корреляции);
найти коэффициент детерминации;
проверить значимость уравнения регрессии в целом с помощью F – критерия Фишера;
найти среднюю относительную ошибку аппроксимации.
5. Составить сводную таблицу вычислений; выбрать лучшую модель; дать интерпретацию рассчитанных характеристик.
6. По лучшей модели составить прогноз на следующие два года показателя у (выручка), если х (объем капиталовложений) увеличивается на 10% по сравнению с последним годом.
7. Построить графики уравнений регрессии; отметить точки прогноза.
Задача 1 3
Задача 2 22
Литература 42
Имеются данные, характеризующие выручку (у, млн. руб.) предприятия «АВС» в зависимости от капиталовложений (х, млн. руб.) за последние 10 лет.
Время, t |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 |
Выручка, у |
56,7 |
55,9 |
54,9 |
53,9 |
55,1 |
55,8 |
55,9 |
56,0 |
56,9 |
56,8 |
Объем капитало- |
20,1 |
20,3 |
20,4 |
20,2 |
20,6 |
20,9 |
21,1 |
21,8 |
23,4 |
22,8 |
Решение
Уравнение парной регрессии.
Строим поле корреляции
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Строим таблицу для расчета показателей
x |
y |
x2 |
y2 |
x · y |
20,1 |
56,7 |
404,01 |
3214,89 |
1139,67 |
20,3 |
55,9 |
412,09 |
3124,81 |
1134,77 |
20,4 |
54,9 |
416,16 |
3014,01 |
1119,96 |
20,2 |
53,9 |
408,04 |
2905,21 |
1088,78 |
20,6 |
55,1 |
424,36 |
3036,01 |
1135,06 |
20,9 |
55,8 |
436,81 |
3113,64 |
1166,22 |
21,1 |
55,9 |
445,21 |
3124,81 |
1179,49 |
21,8 |
56 |
475,24 |
3136 |
1220,8 |
23,4 |
56,9 |
547,56 |
3237,61 |
1331,46 |
22,8 |
56,8 |
519,84 |
3226,24 |
1295,04 |
211,6 |
557,9 |
4489,32 |
31133,23 |
11811,25 |
Для наших данных система уравнений имеет вид
10a + 211,6 b = 557,9
211,6 a + 4489,32 b = 11811,25
Решаем систему и получаем: b = 0,513, a = 44,9353
Уравнение регрессии (эмпирическое уравнение регрессии) имеет вид:
y = 0,513 x + 44,9353
Линия регрессии:
Параметры уравнения регрессии.
Выборочные средние.
x = ∑xi;n = 2116;10 = 2116; y = ∑yi;n = 5579;10 = 5579;
xy = ∑xiyi;n = 1181125;10 = 118113
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 448932;10 – 21162 = 119;
S2y = ∑y2i;n – y2 = 3113323;10 – 55792 = 08
Среднеквадратическое отклонение
Sx = S2x = 119 = 1089; Sy = S2y = 08 = 0894
Ковариация.
covxy = x·y – x·y = 118113 – 2116·5579 = 061
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
rxy = x·y –x·y ;Sx·Sy = 118113 – 2116·5579;1089·0894 = 0625
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X заметна и прямая.
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 0,51 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.51.
Коэффициент a = 44.94 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе – обратная). В нашем примере связь прямая.
Коэффициент детерминации,
R2= 0,6252 = 0,3908 т.е. в 39,08 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 60,92 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,25 |
0,83 |
2,11 |
20,3 |
55,9 |
55,35 |
0,0121 |
0,3 |
20,4 |
54,9 |
55,4 |
0,79 |
0,25 |
20,2 |
53,9 |
55,3 |
3,57 |
1,95 |
20,6 |
55,1 |
55,5 |
0,48 |
0,16 |
20,9 |
55,8 |
55,66 |
0,0001 |
0,0206 |
21,1 |
55,9 |
55,76 |
0,0121 |
0,0198 |
21,8 |
56 |
56,12 |
0,0441 |
0,014 |
23,4 |
56,9 |
56,94 |
1,23 |
0,00153 |
22,8 |
56,8 |
56,63 |
1,02 |
0,0285 |
211,6 |
557,9 |
557,9 |
7,99 |
4,87 |
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2 = ∑yi – yx2;n – m – 1; S2 = 487;8 = 0608
S2 = 0,608 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
S = S2 = 0608 = 078
S = 0,78 – стандартная ошибка оценки (стандартная ошибка регрессии).
Sa – стандартное отклонение случайной величины a.
Sa = S ∑x2;n Sx
Sa = 078 448932;10 • 1089 = 48
Sb – стандартное отклонение случайной величины b.
Sb = S;n Sx
Sb = 0.78; 10 • 1.089 = 0.23
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
t–статистика, Критерий Стьюдента,
tкрит (n–m–1;α/2) = (8;0,025) = 2,306
tb = b;Sb
tb = 051;023 = 227
Поскольку 2,27 < 2,306, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
ta = a;Sa
ta = 4494;48 = 937
Поскольку 9,37 > 2,306, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
F–статистика. Критерий Фишера.
R2 = 1 – ∑yi – yx2; ∑yi – y2 = 1 – 487;799 = 03908
F = R2;1 – R2n – m –1;m
F = 03908;1 – 0390810–1–1;1 = 513
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F–критерием Фишера и t–статистикой Стьюдента выражается равенством:
t2r = t2b = F = 513 = 227
Гиперболическое уравнение регрессии имеет вид y = b/x + a
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид вид y = b/x + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
После линеаризации получим: y=bx + a
Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑(1/x) = ∑y
a∑1/x + b∑(1/x2) = ∑y/x
1/x |
y |
1/x2 |
y2 |
y/x |
0,0498 |
56,7 |
0,00248 |
3214,89 |
2,82 |
0,0493 |
55,9 |
0,00243 |
3124,81 |
2,75 |
0,049 |
54,9 |
0,0024 |
3014,01 |
2,69 |
0,0495 |
53,9 |
0,00245 |
2905,21 |
2,67 |
0,0485 |
55,1 |
0,00236 |
3036,01 |
2,67 |
0,0478 |
55,8 |
0,00229 |
3113,64 |
2,67 |
0,0474 |
55,9 |
0,00225 |
3124,81 |
2,65 |
0,0459 |
56 |
0,0021 |
3136 |
2,57 |
0,0427 |
56,9 |
0,00183 |
3237,61 |
2,43 |
0,0439 |
56,8 |
0,00192 |
3226,24 |
2,49 |
0,47 |
557,9 |
0,0225 |
31133,23 |
26,42 |
Для наших данных система уравнений имеет вид
10a + 0,47 b = 557,9
0,47 a + 0,0225 b = 26,42
Решаем систему и получаем: b = –238,6259, a = 67,0958
Уравнение регрессии (эмпирическое уравнение регрессии):
y = –238,6259 / x + 67,0958
Линия регрессии
Выборочные средние.
x = ∑xi;n = 047;10 = 00474
y = ∑yi;n = 5579;10 = 5579
xy = ∑xiyi;n = 2642;10 = 264
Выборочные дисперсии:
S2x = ∑x2i;n – x2 = 00225;10 – 004742 = 50E–6
S2y = ∑y2i;n – y2 = 3113323;10 – 55792 = 08
Среднеквадратическое отклонение
Sx = S2x = 50E–6 = 000233
Sy = S2y = 08 = 0894
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
b = x • y–x • y;S2x = 264–00474 • 5579;50E–6 = –2386259
Эмпирическое корреляционное отношение.
η = ∑y – yx2; ∑yi – y2
η = 3088;799 = 0622
где
y – yx2 = 799 – 49 = 3088
Индекс корреляции.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
R = 1 – ∑yi – yx2; ∑yi – y2
R = 1 – 49;799 = 062
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 - ∑yi - yx2; ∑yi - y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации.
R2 = 1 – ∑yi – yx2; ∑yi – y2 ; R2 = 1– 49;799 = 0387
т,е, в 38,66 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 61.34 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x |
y |
y(x) |
(yi–ycp)2 |
(y–y(x))2 |
20,1 |
56,7 |
55,22 |
0,83 |
2,18 |
20,3 |
55,9 |
55,34 |
0,0121 |
0,31 |
20,4 |
54,9 |
55,4 |
0,79 |
0,25 |
20,2 |
53,9 |
55,28 |
3,57 |
1,91 |
20,6 |
55,1 |
55,51 |
0,48 |
0,17 |
20,9 |
55,8 |
55,68 |
0,0001 |
0,0148 |
21,1 |
55,9 |
55,79 |
0,0121 |
0,0129 |
21,8 |
56 |
56,15 |
0,0441 |
0,0224 |
23,4 |
56,9 |
56,9 |
1,23 |
4,0E–6 |
22,8 |
56,8 |
56,63 |
1,02 |
0,029 |
211,6 |
557,9 |
557,9 |
7,99 |
4,9 |