Автор работы: Пользователь скрыл имя, 23 Ноября 2011 в 17:41, контрольная работа
Построение модели для пространственных данных
Для этого задания каждый студент выбирает из предложенного файла не менее 50 наблюдений для построения моделей. В файле Квартиры.sta представлены данные о квартирах на вторичном рынке жилья в г. Минске за июль 2006 года. Набор факторов и их количество определяется студентом самостоятельно. Проверка качества модели осуществляется по следующим этапам:
1. Проверка значимости коэффициентов регрессии.
2. Проверка значимости уравнения в целом.
3. Проверка остатков на отсутствие автокорреляции, гетероскедастичности.
4. Проверка остатков на нормальность.
Для этого задания каждый студент выбирает из предложенного файла не менее 50 наблюдений для построения моделей. В файле Квартиры.sta представлены данные о квартирах на вторичном рынке жилья в г. Минске за июль 2006 года. Набор факторов и их количество определяется студентом самостоятельно. Проверка качества модели осуществляется по следующим этапам:
1. Проверка значимости коэффициентов регрессии.
2. Проверка значимости уравнения в целом.
3. Проверка остатков на отсутствие автокорреляции, гетероскедастичности.
4. Проверка остатков на нормальность.
В файле Квартиры.sta представлены данные о квартирах на вторичном рынке жилья в г. Минске за июль 2006 года. Названия и описания переменных приведены в следующей таблице:
Имя переменной | Описание |
raion | Район, в котором расположена квартира |
komnat | Количество комнат |
NKomnat | Количество несмежных комнат |
Var3 | Улица, на которой расположена квартира |
Cena | Цена квартиры |
PlOb | Общая площадь |
PlochadZ | Жилая площадь |
PlochadKukh | Площадь кухни |
Etaz | Этаж расположения квартиры/число этажей |
Type | Тип дома |
tel | Наличие телефона |
balkon | Наличие/тип балкона |
GodPostr | Год постройки |
На основе исходных данных создадим новый файл, содержащий следующие переменные: Число комнат, Общая площадь, Тип дома и Цена (тыс. долл.).
Выберем из исходного файла 60 записей. В качестве зависимой переменной выберем цену квартиры, а в качестве независимых переменных – число комнат, общую площадь и тип дома.
Вызовем модуль Множественная регрессия (Statistics ® Multiple Regression).
Выберем переменные (Variables):
зависимая (Dependent) – Цена;
независимые
(Independent) – Число комнат, Общая площадь,
Тип дома (1–3).
Проанализируем полученные результаты множественной регрессии:
Коэффициенты регрессионной модели приведены в третьем столбце (B).
Построенная регрессионная модель имеет вид:
Цена = 9,783 – 0,845∙(Число комнат) + 0,983∙(Общая площадь) – 0,778∙(Тип дома).
Табличное значение критерия Стьюдента, соответствующее доверительной вероятности g = 0,95 и числу степеней свободы v = n – m – 1 = 56: tкр. = t0,05;56 » 2,0.
В полученном уравнении значимым являются только коэффициент регрессии для общей площади и постоянная, т.к. для них расчетное значение t-критерия больше табличного.
Параметры модели:
Коэффициент множественной корреляции Multiple R = 0,928;
Коэффициент детерминации Multiple R2 = 0,861;
Скорректированный
на потерю степеней свободы
коэффициент множественной детерминации
Adjusted R2 = 0,854;
Критерий Фишера F(4, 65) = 115,587;
Уровень значимости модели р < 0,000;
Стандартная ошибка оценки Std. Error of Estimate = 7,726.
Проанализируем данные множественной регрессии.
Коэффициент множественной корреляции Multiple R = 0,928 построенной модели высок, что говорит о сильной связи между исследуемыми факторами.
Коэффициент детерминации Multiple R2 = 0,861, что говорит о том, что 86,1% вариации переменной Цена объясняется вариацией независимых переменных, а на 13,9% приходятся на долю других неучтенных факторов.
Критическое (табличное) значение критерия Фишера для доверительной вероятности g = 0,95 и числа степеней свободы n1 = 4 и n2 = 65: Fкр = F(0,05;3;56) » 2,8. Расчетное значение критерия Фишера F(4, 65) = 115,6 превышает табличное значение критерия Fтабл = 2,8, что говорит об адекватности модели экспериментальным данным. Уровень значимости p = 0,000 показывает, что построенная регрессия значима при 0,000% уровне значимости.
Исследуем степень корреляционной зависимости между переменными. Для этого построим корреляционную матрицу (установим флажок в строке Review descriptive statistics, correlations matrix в окне Multiple Regressions на вкладке Advanced).
Из корреляционной матрицы видно, что наибольшее значение коэффициента корреляции наблюдается между переменными Общая площадь и Цена (0,93), откуда следует тесная взаимосвязь этих двух параметров.
Также велико значение коэффициента корреляции между переменными Общая площадь и Число комнат (0,87), но данные переменные являются объясняющими. Такая тесная связь между объясняющими переменными может свидетельствовать о мультиколлинеарности.
Проведем анализ остатков регрессии.
Остатки представляют собой разности между наблюдаемыми значениями и модельными, то есть значениями, подсчитанными по модели с оцененными параметрами.
Проверим остатки на наличие автокорреляции. Для этого вычислим статистику Дарбина–Уотсона (Durbin–Watson Stat).
Результаты вычисления статистики Дарбина–Уотсона:
Наблюдаемое значение критерия Дарбина–Уотсона: DW = 1,693.
По таблице определяем значащие точки dL и dU для 5% уровня значимости.
Для m = 3 и n = 60 dL = 1,48; dU = 1,69.
Так как DW > dU (1,693 < 1,69), то в модели отсутствует автокорреляция остатков/
Для проверки наличия гетероскедастичности воспользуемся тестом Уайта.
Результаты множественной регрессии:
Расчетное значение критерия Фишера F = 0,161 меньше табличного значения критерия Fкр = F(0,05;6;53) » 2,3, что говорит об отсутствии в модели гетероскедастичности.
Проверим соответствие остатков нормальному распределению, для этого построим гистограмму остатков.
Как видно из рисунка вид гистограммы в целом соответствует кривой нормального распределения, что позволяет предположить нормальность остатков случайных отклонений.
Вывод:
Построенное уравнении регрессии не может быть использовано в практических целях, так как не все коэффициенты регрессии статистически значимы, что может привести к ненадежности оценок.
Представить представленные ниже модели в приведенном виде. Что можно сказать об идентифицируемости модели? Какие из переменных являются эндогенными, а какие из переменных являются экзогенными? В моделях через εt и vt обозначены случайные члены.
2.5. Рассматривается макроэкономическая модель вида
сt =β0 + β1yt + β2rt + ε1t,
rt= α0 + α1it + α2mt + ε2t,
it = γ0 + γ1rt + γ2(yt – yt–1) + ε3t,
yt = сt + it + gt,
где сt – объем потребления,
it – объем инвестиций,
yt – ВВП,
mt – денежная масса,
rt – процентная ставка,
gt – объем государственных расходов в период t.
Для структурной формы модели существенное значение имеет деление переменных модели на два класса: эндогенные переменные – взаимозависимые переменные, которые определяются внутри модели и экзогенные переменные – независимые переменные, которые определяются вне системы. Кроме того, вводится также понятие предопределенных переменных. Под ними понимаются экзогенные переменные системы и лаговые эндогенные переменные системы (переменные, относящиеся к предыдущим моментам времени).
У данной модели имеется 4 эндогенных переменных:
сt – объем потребления,
rt – процентная ставка,
it – объем инвестиций,
yt – объем ВВП
и 3 предопределенных переменных, из которых 2 экзогенных:
mt – денежная масса,
gt – объем государственных расходов
и 1 эндогенная лаговая:
yt–1 – объем ВВП в период t–1.
Структурную форму модели можно записать в другой форме, в которой все эндогенные переменные линейно зависят уже только от экзогенных (предопределенных) переменных. Такая форма называется приведенной формой модели.
Для данной модели приведенная форма имеет вид:
Идентификация
– это единственность соответствия
между приведенной и
Модель идентифицируема, если все ее структурные коэффициенты определяются однозначно, единственным образом по коэффициентам приведенной формы модели, то есть если число параметров структурной формы модели равно числу параметров приведенной формы модели.
Модель
неидентифицируема – если число
структурных коэффициентов
Модель
сверхидентифицируема – если число
структурных коэффициентов
Необходимое условие идентифицируемости модели: Чтобы уравнение было идентифицируемо, необходимо, чтобы число экзогенных (предопределенных) переменных (D), отсутствующих в данном уравнении, но присутствующих в системе, было равно числу эндогенных переменных в данном уравнении (H) без одного.
D + 1 = H – уравнение идентифицируемо;
D + 1 < H – уравнение неидентифицируемо;