Автор работы: Пользователь скрыл имя, 05 Июня 2013 в 18:37, шпаргалка
Работа содержит ответы на вопросы для экзамена по эконометрике.
Пятое условие: распределены независимо от при . Это условие предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Если один случайный член велик и положителен в одном направлении, не должно быть систематической тенденции к тому, что он будет таким же великим и положительным (то же можно сказать и о малых, и об отрицательных остатках). Теоретическая ковариация должна равняться нулю, поскольку . Теоретические средние для и равны нулю в силу третьего условия теоремы. При невыполнении этого условия оценки, полученные по методу наименьших квадратов, будут также неэффективны.
Билет 19. Отбор
факторных признаков для
Билет 20. Явление мультиколлинеарности факторов в регрессионной модели. Способы определения наличия и отсутствия мультиколлинеарности.
Под Мультиколлинеарность понимается высокая взаимная коррелированность объясняющих переменных. Мультиколлинеарность может провялятся в функциональной и стохастической формах.
Точных способов определения наличия мультиколлинеарности не существует. Один из подходов заключается в анализе корреляционной матрицы между объясняющими переменными X1,X2,…..Xn и выявлении пар переменных, имеющих высокие коэффициенты корреляции (обычно больше 0,8). Если такие коэффициенты существуют, то говорят о наличии мультиколлинеарности.
Так же полезно находить коэффициент множественной детерминации между одной из объясняющих переменных и некоторой группой из них. Наличие высокого множественного коэффициента детерминации (обычно больше 0,6) свидетельствует о мультиколлинеарности.
Другой подход состоит в исследовании обратной матрицы. Если определитель матрицы либо ее минимальное собственное значение близко к 0, то говорят о наличии мультиколлинеарности.
Метод главных компонент является одним из основных методов исключения переменных из модели множественной регрессии.
Данный метод используется для
исключения или уменьшения мультиколлинеарности
факторных переменных модели регрессии.
Суть метода заключается в сокращении
числа факторных переменных до наиболее
существенно влияющих факторов. Это
достигается с помощью
Метод пошагового включения переменных состоит в выборе из всего возможного набора факторных переменных именно те, которые оказывают существенное влияние на результативную переменную.
Метод пошагового включения осуществляется по следующему алгоритму:
1) из всех факторных переменных
в модель регрессии включаются
те переменные, которым соответствует
наибольший модуль линейного
коэффициента парной
2) при добавлении в модель
регрессии новых факторных
где q – число уже включённых в модель регрессии факторных переменных.
При проверке основной гипотезы возможны следующие ситуации.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т. е. Fнабл›Fкрит, то основная гипотеза о необоснованности включения факторной переменной xk в модель множественной регрессии отвергается. Следовательно, включение данной переменной в модель множественной регрессии является обоснованным.
Если наблюдаемое значение F-критерия
(вычисленное по выборочным данным)
меньше или равно критического значения
F-критерия (определённого по таблице
распределения Фишера-
3) проверка факторных переменных
на значимость осуществляется
до тех пор, пока не найдётся
хотя бы одна переменная, для
которой не выполняется
Билет 21. Метод наименьших квадратов для оценивания параметров модели множественной линейной регрессии. Матричная форма системы нормальных уравнений. Решение системы нормальных уравнений в матричной форме.
В общем виде линейную модель множественной регрессии можно записать следующим образом:
yi=β0+β1x1i+…+βmxmi+εi,
где yi – значение i-ой результативной переменной,
x1i…xmi – значения факторных переменных;
β0…βm – неизвестные коэффициенты модели множественной регрессии;
εi – случайные ошибки модели множественной регрессии.
В результате оценивания данной эконометрической модели определяются оценки неизвестных коэффициентов. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). Суть метода наименьших квадратов состоит в том, чтобы найти такой вектор β оценок неизвестных коэффициентов модели, при которых сумма квадратов отклонений (остатков) наблюдаемых значений зависимой переменной у от расчётных значений ỹ (рассчитанных на основании построенной модели регрессии) была бы минимальной.
Матричная форма функционала F метода наименьших квадратов:
где
– случайный вектор-столбец значений результативной переменной размерности (n*1);
– матрица значений факторной переменной размерности (n*(m+1)). Первый столбец является единичным, потому что в модели регрессии коэффициент β0 умножается на единицу;
В процессе минимизации функции (1) неизвестными являются только значения коэффициентов β0…βm, потому что значения результативной и факторных переменных известны из наблюдений. Для определения минимума функции (1) необходимо вычислить частные производные этой функции по каждому из оцениваемых параметров и приравнять их к нулю. Результатом данной процедуры будет стационарная система уравнений для функции (1):
где
– вектор-столбец неизвестных коэффициентов модели регрессии размерности ((m+1)*1);
Общий вид стационарной системы уравнений для функции (1):
Решением стационарной системы уравнений будут МНК-оценки неизвестных параметров линейной модели множественной регрессии:
Оценим с помощью метода наименьших
квадратов неизвестные
yi=β0+β1x1i+β2x2i+εi,
где
Чтобы рассчитать оценки неизвестных
коэффициентов β0,β1 и β2 данно
Для определения экстремума функции нескольких переменных, частные производные по этим переменным приравниваются к нулю. Результатом данной процедуры будет стационарная система уравнений для модели множественной линейной регрессии с двумя переменными:
В результате элементарных преобразований данной стационарной системы уравнений получим систему нормальных уравнений:
Данная система называется системой нормальных уравнений относительно коэффициентов
для модели регрессии yi=β0+β1x1i+β2x2i+
Полученная система нормальных уравнений является квадратной, т. к. количество уравнений равняется количеству неизвестных переменных, поэтому коэффициенты
можно рассчитать с помощью метода Крамера или метода Гаусса.
Рассмотрим подробнее метод Крамера решения квадратных систем нормальных уравнений.
Единственное решение
где Δ – основной определитель квадратной системы линейных уравнений;
Δj – определитель, полученный из основного определителя путём замены j-го столбца на столбец свободных членов.
При использовании метода Крамера возможно возникновение следующих ситуаций:
1) если основной определитель системы Δ равен нулю и все определители Δjтакже равны нулю, то данная система имеет бесконечное множество решений;
2) если основной определитель системы Δ равен нулю и хотя бы один из определителей Δjтакже равен нулю, то система решений не имеет.
Билет 23 . проверки адекватности модели множественной линейной регрессии эмпирическим данным.
Качество модели регрессии связывают с
адекватностью модели наблюдаемым (эмпирическим)
данным. Проверка адекватности (или соответствия)
модели регрессии наблюдаемым данным
проводится на основе анализа остатков
-
.
Анализ остатков позволяет получить представление,
насколько хорошо подобрана сама модель
и насколько правильно выбран метод оценки
коэффициентов. Согласно общим предположениям
регрессионного анализа, остатки должны
вести себя как независимые (в действительности,
почти независимые) одинаково распределенные
случайные величины.
Качество модели регрессии оценивается
по следующим направлениям:
При анализе качества модели регрессии,
в первую очередь, используется коэффициент
детерминации, который определяется
следующим образом:
, (2.5)
где
- среднее
значение зависимой переменной,
- предсказанное
(расчетное) значение зависимой переменной.
^ Коэффициент детерминации показывает
долю вариации результативного признака,
находящегося под воздействием изучаемых
факторов, т. е. определяет, какая доля
вариации признака Y учтена в модели и обусловлена
влиянием на него факторов. Чем ближе
к 1,
тем выше качество модели.
Для оценки качества регрессионных моделей
целесообразно также использовать коэффициент множественной
корреляции (индекс корреляции) R
R =
=
(2.6)
Данный коэффициент является универсальным,
так как он отражает тесноту связи и точность
модели, а также может использоваться
при любой форме связи переменных. Важным
моментом является проверка значимости
построенного уравнения в целом и отдельных
параметров.
Оценить значимость уравнения регрессии
– это означает установить, соответствует
ли математическая модель, выражающая
зависимость между Y и Х, фактическим данным
и достаточно ли включенных в уравнение
объясняющих переменных Х для описания
зависимой переменной Y. Оценка значимости
уравнения регрессии производится для
того, чтобы узнать, пригодно уравнение
регрессии для практического использования
(например, для прогноза) или нет.
Для проверки значимости модели регрессии
используется F-критерий Фишера. Если
расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы,
где k – количество факторов, включенных
в модель, больше табличного при заданном
уровне значимости, то модель считается
значимой.
(2.7)
В качестве меры точности применяют
несмещенную оценку дисперсии остаточной
компоненты, которая представляет собой
отношение суммы квадратов уровней остаточной
компоненты к величине (n- k -1), где k – количество
факторов, включенных в модель. Квадратный
корень из этой величины (
) называется стандартной ошибкой:
(2.8)
значимость отдельных коэффициентов
регрессии проверяется по t-статистике
путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного
члена):
, (2.9)
где Saj — это стандартное
(среднеквадратическое) отклонение коэффициента
уравнения регрессии aj. Величина Saj пре
где
- диагональный
элемент матрицы
.
Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит
его табличное значение при заданном уровне
значимости, коэффициент регрессии считается
значимым. В противном случае фактор, соответствующий
этому коэффициенту, следует исключить
из модели (при этом ее качество не ухудшится).