Математические основы регрессионно-корреляционного анализа. Нелинейные эконометрические модели

Автор работы: Пользователь скрыл имя, 05 Марта 2014 в 17:06, доклад

Описание работы

Основные понятия.
Оценка тесноты связи.
Оценка значимости уравнения регрессии, его коэффициентов, коэффициента детерминации.
Расчет доверительных интервалов.

Файлы: 1 файл

Matemat_osnovy_regressionno-korrelyats_analiza.doc

— 116.50 Кб (Скачать файл)

Тема: Математические основы регрессионно-корреляционного анализа. Нелинейные эконометрические модели

 

Основные понятия

 

Парная регрессия – регрессия между двумя переменными y и x, то есть модель вида: y=f(x)+ε, где:

y - зависимая переменная (результативный признак),

x – независимая, объясняющая, переменная ( признак- фактор),

ε - возмущение или стохастическая переменная, включающая влияние неучтенных в модели факторов.

Основные типы функций, используемые при количественной оценке связей:

Линейная функция: y=a+bx;

Нелинейные функции: y= a+b/x – гипербола;

y=a+bx+cx2 – парабола;

y=a+bx+cx2+dx3– кубический многочлен;

y=axb – степенная функция;

y=abx– показательная функция;

y=a+blgx – логарифмическая функция;

Построение уравнения регрессии

Постановка задачи. По имеющимся данным n наблюдений за совместным изменением двух параметров x и y необходимо определить аналитическую зависимость ŷ=f(x), наилучшим образом описывающую данные наблюдений.

Построение уравнения регрессии осуществляется в два этапа (предполагает решение двух задач):

  • спецификация модели (определение вида аналитической зависимости ŷ=f(x));
  • оценка параметров выбранной модели.

Спецификация модели

Парная регрессия применяется, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Применяется три основных метода выбора вида аналитической зависимости:

  • графический (на основе анализа поля корреляций);
  • аналитический, т. е. исходя из теории изучаемой взаимосвязи;
  • экспериментальный, т. е. путем сравнения величины остаточной дисперсии Dост или средней ошибки аппроксимации A, рассчитанных для различных моделей регрессии (метод перебора).

Оценка параметров модели

Для оценки параметров регрессий, линейных по этим параметрам, используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических значений ŷx при тех же значениях фактора x минимальна, т. е.

S(y - ŷx)2®min

В случае линейной регрессии параметры а и b находятся из следующей системы нормальных уравнений метода МНК:

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

Для нелинейных уравнений регрессии, приводимых к линейным с помощью преобразования (x, y) → (x’, y’), система нормальных уравнений имеет вид в преобразованных переменных x’, y’.

Коэффициент b при факторной переменной x имеет следующую интерпретацию: он показывает, на сколько изменится в среднем величина y при изменении фактора x на 1 единицу измерения.

 

 

 

Оценка тесноты связи

 

Тесноту связи изучаемых явлений оценивает:

Œ линейный коэффициент парной корреляции для линейной регрессии :

Если >0, то корреляционная связь между переменными называется прямой, если <0– обратной. При прямой (обратной) связи увеличение одной из переменных ведет к увеличению (уменьшению) условной (групповой) средней другой переменной.

Коэффициент (при достаточно большом объеме выборки n) обладает следующими свойствами:

  1. Принимает значения на отрезке [-1;1], т.е. -1≤ ≤1. Чем ближе | | к единице, тем теснее связь.
  2. При =±1 корреляционная связь представляет линейную функциональную зависимость. При этом, все наблюдаемые значения располагаются на прямой линии.
  3. При =0 линейная корреляционная связь отсутствует. При этом линия регрессии параллельна оси ОХ.

Качественные характеристики связи: если  0 < ≤ 0,3 – связь практически отсутствует; 0,3 < ≤ 0,5 – связь слабая; 0,5 < ≤ 0,7 – связь умеренная; 0,7 < < 1 – связь сильная (тесная).

 

 индекс корреляции , - для нелинейной регрессии :

Чем выше значения индекса, тем ближе расчетные значения результативного признака к фактическим.

 

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент детерминации r2xy (для линейной регрессии) или индекс детерминации ρ2xy (для нелинейной регрессии).

Коэффициент детерминации – квадрат коэффициента или индекса корреляции.

Для оценки качества построенной модели регрессии можно использовать показатель (коэффициент, индекс) детерминации  либо среднюю ошибку аппроксимации. Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные.

Средняя ошибка аппроксимации – среднее относительное отклонение расчетных значений от фактических:

 

Построенное уравнение регрессии считается удовлетворительным, если значение A не превышает 10 %.

 

 

 

Оценка значимости уравнения регрессии, его коэффициентов, коэффициента детерминации

 

Оценка значимости всего уравнения регрессии в целом осуществляется с помощью F-критерия Фишера. F-критерий Фишера заключается в проверке гипотезы Но о статистической незначимости уравнения регрессии. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.

Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы

,

где n – число единиц совокупности; m – число параметров при переменных. Для линейной регрессии m = 1 .Для нелинейной регрессии вместо r2xy используется r2xy.

Fтабл – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m, k2 = n – m – 1 (для линейной регрессии m = 1) и уровне значимости α.. Уровень значимости α – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина α принимается равной 0,05 или 0,01.

Если Fтабл < Fфакт, то Н0 (гипотеза о случайной природе оцениваемых характеристик) отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Для оценки статистической значимости коэффициентов линейной регрессии и линейного коэффициента парной корреляции rxy применяется t-критерий Стьюдента и рассчитываются доверительные интервалы каждого из показателей.

Согласно t-критерию выдвигается гипотеза Н0 о случайной природе показателей, т. е. о незначимом их отличии от нуля. Далее рассчитываются фактические значения критерия tфакт для оцениваемых коэффициентов регрессии и коэффициента корреляции rxy путем сопоставления их значений с величиной стандартной ошибки

Стандартные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

 

 

Сравнивая фактическое и критическое (табличное) значения t-статистики tтабл и tфакт принимают или отвергают гипотезу Н0. tтабл – максимально возможное значение критерия под влиянием случайных факторов при степени свободы k = n-2 и уровне значимости α.

Если tтабл < tфакт, то Н0 отклоняется, т. е. a, b и rxy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт, то гипотеза Н0  не отклоняется и признается случайная природа формирования а, b и rxy .

 

 

 

 

 

Расчет доверительных интервалов

 

Рассчитанные значения показателей (коэффициенты a, b, rxy) являются приближенными, полученными на основе имеющихся выборочных данных. Для оценки того, насколько точные значения показателей могут отличаться от рассчитанных, осуществляется построение доверительных интервалов.

Доверительные интервалы определяют пределы, в которых лежат точные значения определяемых показателей с заданной степенью уверенности, соответствующей заданному уровню значимости α.

Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:

Формулы для расчета доверительных интервалов имеют следующий вид:

 

Если в границы доверительного интервала попадает ноль, т.е нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.

Прогнозное значение ур определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения хр.  Вычисляется средняя  стандартная  ошибка  прогноза :

где

 

и строится доверительный интервал прогноза:

где   

 

Коэффициент эластичности

 

В экономических исследованиях широкое применение находит такой показатель, как коэффициент эластичности, вычисляемый по формуле

Коэффициент эластичности показывает на сколько процентов изменится результат у при изменении фактора х на 1% от своего номинального значения. Для линейной регрессии коэффициент эластичности равен

и зависит от x, поэтому рассчитывают средний коэффициент эластичности

 

 


 



Информация о работе Математические основы регрессионно-корреляционного анализа. Нелинейные эконометрические модели