Математика в экономике

Автор работы: Пользователь скрыл имя, 02 Мая 2015 в 22:22, контрольная работа

Описание работы

ЗАДАЧА 1
Имеются данные, характеризующие выручку (у, млн. руб.) предприятия «АВС» в зависимости от капиталовложений (х, млн. руб.) за последние 10 лет.
1. Построить поле корреляции.
2. Найти параметры уравнения линейной регрессии ; дать экономическую интерпретацию параметров а и b.
3. Составить уравнения нелинейных регрессий:
• гиперболической ;
• степной ;
• показательной
4. Для каждой из моделей:
 найти коэффициент парной корреляции (для нелинейных регрессий – индекс корреляции);
 найти коэффициент детерминации;
 проверить значимость уравнения регрессии в целом с помощью F – критерия Фишера;
 найти среднюю относительную ошибку аппроксимации.
5. Составить сводную таблицу вычислений; выбрать лучшую модель; дать интерпретацию рассчитанных характеристик.
6. По лучшей модели составить прогноз на следующие два года показателя у (выручка), если х (объем капиталовложений) увеличивается на 10% по сравнению с последним годом.
7. Построить графики уравнений регрессии; отметить точки прогноза.

Содержание работы

Задача 1 3
Задача 2 22
Литература 42

Файлы: 1 файл

Эконометрика на 7.03.docx

— 176.86 Кб (Скачать файл)

Тестирование и устранение мультиколлинеарности.

Наиболее полным алгоритмом исследования мультиколлинеарности является алгоритм Фаррара–Глобера. С его помощью тестируют три вида мультиколлинеарности:

1. Всех факторов (χ2 – хи–квадрат).

2. Каждого  фактора с остальными (критерий  Фишера).

3. Каждой пары  факторов (критерий Стьюдента).

 Проверим  переменные на мультиколлинеарность методом Фаррара–Глоубера по первому виду статистических критериев (критерий "хи–квадрат").

Формула для расчета значения статистики Фаррара–Глоубера:

χ2 = –[n–1–(2m+5)/6]ln(det[R])

где m = 2 – количество факторов, n = 10 – количество наблюдений, det[R] – определитель матрицы парных коэффициентов корреляции R.

Сравниваем его с табличным значением при v = m/2(m–1) = 1 степенях свободы и уровне значимости α. Если χ2 > χтабл2, то в векторе факторов есть присутствует мультиколлинеарность.

χтабл2(1;0.05) = 3.84146

 Проверим  переменные на мультиколлинеарность по второму виду статистических критериев (критерий Фишера).

Определяем обратную матрицу D = R–1:

D = | 2333;–1082;–1061;–1082;1646;00858;–1061;00858;1627

Вычисляем F–критерии Фишера:

Fk = dkk-1n-m;m-1

где dkk – диагональные элементы матрицы.

Рассчитанные значения критериев сравниваются с табличными при v1=n–m и v2=m–1 степенях свободы и уровне значимости α. Если Fk > FТабл, то k–я переменная мультиколлинеарна с другими.

v1=10–2 = 8; v2=2–1 = 1. FТабл(8;1) = 239

F1 = 2333–110–2;2–1 = 1067

Поскольку F1 ≤ Fтабл, то переменная y немультиколлинеарна с другими,

F2 = 1646–110–2;2–1 = 517

Поскольку F2 ≤ Fтабл, то переменная x1  немультиколлинеарна с другими,

F3 = 1627–110–2;2–1 = 501

Поскольку F3 ≤ Fтабл, то переменная x2  немультиколлинеарна с другими,

 

Проверим переменные на мультиколлинеарность по третьему виду статистических критериев (критерий Стьюдента). Для этого найдем частные коэффициенты корреляции.

Частные коэффициенты корреляции.

Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.

На основании частных коэффициентов можно сделать вывод об обоснованности включения переменных в регрессионную модель. Если значение коэффициента мало или он незначим, то это означает, что связь между данным фактором и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели.

Можно сделать вывод, что ни один из факторов не следует использовать при построении регрессионного уравнения.

Модель регрессии в стандартном масштабе.

Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:

tj = xji–xj;Sxj

где хji – значение переменной хji в i–ом наблюдении.

ty = yi–xj;Sy

Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S.

Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:

ty = ∑βjtxj

Для оценки β–коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид:

rx1y=β1+rx1x2•β2 + ... + rx1xm•βm

rx2y=rx2x1•β1 + β2 + ... + rx2xm•βm

...

rxmy=rxmx1•β1 + rxmx2•β2 + ... + βm

Для наших данных (берем из матрицы парных коэффициентов корреляции):

0,625 = β1 + 0,355β2

0,619 = 0,355β1 + β2

Данную систему линейных уравнений решаем методом Гаусса: β1 = 0.464; β2 = 0.455; 

Искомое уравнение в стандартизованном масштабе: ty=β1tx1+β2tx2

Расчет β–коэффициентов можно выполнить и по формулам:

β1 = ryx1–ryx2rx1x2;1–rx1x22 = 0625–0619 • 0355;1–03552 = 0464

β2 = ryx2–ryx1rx1x2;1–rx1x22 = 0619–0625 • 0355;1–03552 = 0455

Стандартизированная форма уравнения регрессии имеет вид:

y0 = 0,464x1 + 0,455x2 

Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:

bj = βSy;Sxj ; a = y – ∑bjxj

Анализ параметров уравнения регрессии.

Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации

Для несмещенной оценки дисперсии проделаем следующие вычисления:

Несмещенная ошибка ε = Y – Y(x) = Y – X*s (абсолютная ошибка аппроксимации)

 

Y

Y(x)

ε = Y – Y(x)

ε2

(Y–Yср)2

|ε : Y|

56,7

55,602

1,098

1,205

0,828

0,0194

55,9

55,181

0,719

0,517

0,0121

0,0129

54,9

55,385

–0,485

0,235

0,792

0,00883

53,9

54,811

–0,911

0,831

3,572

0,0169

55,1

55,129

–0,0293

0,00086

0,476

0,000532

55,8

55,741

0,0592

0,00351

0,0001

0,00106

55,9

56,314

–0,414

0,172

0,0121

0,00741

56

56,249

–0,249

0,062

0,0441

0,00445

56,9

56,361

0,539

0,291

1,232

0,00948

56,8

57,127

–0,327

0,107

1,02

0,00575

   

0

3,424

7,989

0,0866


Средняя ошибка аппроксимации

A = ∑|ε : Y|;n 100% = 00866;10 100% = 087%

Оценка дисперсии равна:

se2 = (Y – X*Y(X))T(Y – X*Y(X)) = 3,42

Несмещенная оценка дисперсии равна:

s2 = 1;n–m–1 s2e =  1;10 – 2 – 1342 = 049

Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):

S = S2 =  049 = 07

Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)–1

kx = 07| 74351;–1117;–8337;–1117;00964;–0152;–8337;–0152;1904 = | 36365;–0546;–4078;–0546;00472;–00744;–4078;–00744;0931

Дисперсии параметров модели определяются соотношением S2i = Kii, т,е, это элементы, лежащие на главной диагонали

Sb0 = 36365 = 603

Sb1 = 00472 = 0217

Sb2 = 0931 = 0965

Показатели тесноты связи факторов с результатом.

Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат.

К таким показателям тесноты связи относят: частные коэффициенты эластичности, β–коэффициенты, частные коэффициенты корреляции.

Сравнительная оценка влияния анализируемых факторов на результативный признак.

Сравнительная оценка влияния анализируемых факторов на результативный признак производится:

– средним коэффициентом эластичности, показывающим на сколько процентов среднем по совокупности изменится результат y от своей средней величины при изменении фактора xi на 1% от своего среднего значения;

– β–коэффициенты, показывающие, что, если величина фактора изменится на одно среднеквадратическое отклонение Sxi, то значение результативного признака изменится в среднем на β своего среднеквадратического отклонения;

– долю каждого фактора в общей вариации результативного признака определяют коэффициенты раздельной детерминации (отдельного определения): d2i = ryxiβi.

d21 = 0,63 • 0,464 = 0,29

d22 = 0,62 • 0,455 = 0,28

При этом должно выполняться равенство:

∑d2i = R2 = 0,57

Множественный коэффициент корреляции (Индекс множественной корреляции).

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции.

В отличии от парного коэффициента корреляции, который может принимать отрицательные значения, он принимает значения от 0 до 1.

Поэтому R не может быть использован для интерпретации направления связи. Чем плотнее фактические значения yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, больше величина Ry(x1,...,xm).

Таким образом, при значении R близком к 1, уравнение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат. При значении R близком к 0 уравнение регрессии плохо описывает фактические данные и факторы оказывают слабое воздействие на результат.

R = 1 – s2e; ∑yi – y2 = 1 – 342;799 = 0756

Связь между признаком Y факторами X сильная

Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β–коэффициентов.

R = ∑ryxiβyxi = ryx1βyx1 + ryx2βyx2

R = 0625 • 0464 + 0619 • 0455 = 0571 = 0756

Коэффициент детерминации

R2 = 0,571

Коэффициент детерминации,

R2= 0,7562 = 0,572

Проверка гипотез относительно коэффициентов уравнения регрессии (проверка значимости параметров множественного уравнения регрессии).

Число v = n – m – 1 называется числом степеней свободы. Считается, что при оценивании множественной линейной регрессии для обеспечения статистической надежности требуется, чтобы число наблюдений, по крайней мере, в 3 раза превосходило число оцениваемых параметров.

1) t–статистика

Tтабл (n–m–1;α/2) = (7;0,025) = 2,365

ti = bi;Sbi

Находим стандартную ошибку коэффициента регрессии b0:

Sb0 = 3636 = 603

t0 = 3768;603 = 625>2365

Статистическая значимость коэффициента регрессии b0 подтверждается,

Находим стандартную ошибку коэффициента регрессии b1:

Sb1 = 00472 = 022

t1 = 038;022 = 175<2365

Статистическая значимость коэффициента регрессии b1 не подтверждается,

Находим стандартную ошибку коэффициента регрессии b2:

Sb2 = 093 = 096

t2 = 166;096 = 172<2365

Статистическая значимость коэффициента регрессии b2 не подтверждается.

Доверительный интервал для коэффициентов уравнения регрессии.

Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95%  будут следующими:

(bi – ti Sbi; bi + ti Sbi)

b0: (37,68 – 2,365·6,03; 37,68 + 2,365·6,03) = (23,41;51,94)

b1: (0,38 – 2,365·0,22; 0,38 + 2,365·0,22) = (–0,13;0,89)

b2: (1,66 – 2,365·0,96; 1,66 + 2,365·0,96) = (–0,62;3,94)

Проверка общего качества уравнения множественной регрессии.

Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).

Для ее проверки используют F–критерий Фишера.

При этом вычисляют фактическое (наблюдаемое) значение F–критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.

По таблицам распределения Фишера–Снедоккора находят критическое значение F–критерия (Fкр). Для этого задаются уровнем значимости α (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n – m – 1.

2) F–статистика. Критерий Фишера.

R2 = 1 – s2e;∑yi – y2 = 1 – 342;799 = 0572

Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.

Более объективной оценкой является скорректированный коэффициент детерминации:

R2 = 1 – 1 – R2n–1;n – m – 1

R2 = 1 – 1 – 057210 – 1;10 – 2 – 1 = 0449

Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.

Проверим гипотезу об общей значимости – гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

H0: R2 = 0; β1 = β2 = ... = βm = 0.

H1: R2 ≠ 0.

Проверка этой гипотезы осуществляется с помощью F–статистики распределения Фишера (правосторонняя проверка).

Если F < Fkp  = Fα ; n–m–1, то нет оснований для отклонения гипотезы H0.

F = R2;1 - R2n - m -1;m  = 0.572;1 - 0.57210-2-1;2 = 4.67

Табличное значение при степенях свободы k1 = 2 и k2 = n–m–1 = 10 – 2 – 1 = 7, Fkp(2;7) = 4.74

Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно.

Оценка значимости дополнительного включения фактора (частный F–критерий).

Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Это может быть связано с последовательностью вводимых факторов (т. к. существует корреляция между самими факторами).

Мерой оценки значимости улучшения качества модели, после включения в нее фактора хj, служит частный F–критерий – Fxj:

Fxj = R2 – R2x1xn;1–R2 n – m – 1

где m – число оцениваемых параметров.

В числителе – прирост доли вариации у за счет дополнительно включенного в модель фактора хj.

Если наблюдаемое значение Fxj больше Fkp, то дополнительное введение фактора xj в модель статистически оправдано.

Частный F–критерий оценивает значимость коэффициентов «чистой» регрессии (bj). Существует взаимосвязь между частным F–критерием – Fxj и t–критерием, используемым для оценки значимости коэффициента регрессии при j–м факторе:

tbj=0 = Fxj

Оценим с помощью частного F–критерия:

1) целесообразность  включения в модель регрессии  факторов х1 после введения хj (Fx1).

Определим наблюдаемое значение частного F–критерия:

Fx1 = 0572–0384;1 – 0572 10 – 3 – 1 = 307117846

R2(x2,xn = r2(x2) = 0,61932 = 0,384

Fkp(k1=1;k2=7) = 5,59

Сравним наблюдаемое значение частного F–критерия с критическим:

Fx1>5.59, следовательно, фактор х1  целесообразно включать в модель после введения факторов хj.

2) целесообразность  включения в модель регрессии  факторов х2 после введения хj (Fx2).

Определим наблюдаемое значение частного F–критерия:

Fx2 = 0572–0391;1 – 0572 10 – 3 – 1 = 295192527

R2(x1,xn = r2(x1) = 0,62512 = 0,391

Сравним наблюдаемое значение частного F–критерия с критическим:

Fx2>5,59, следовательно, фактор х2  целесообразно включать в модель после введения факторов хj.

Для построения данной модели прологарифмируем обе части равенства

lg y = lg a + β1 ∙ lg x1 + β2 ∙ lg x2.  

Информация о работе Математика в экономике