Классическая модель множественной регрессии

Автор работы: Пользователь скрыл имя, 17 Мая 2013 в 05:06, курсовая работа

Описание работы

Цель курсовой работы: исследование влияния социально-экономических показателей на объем инвестиций в основной капитал на душу населения.
Задачами данной работы являются:
Построить МНК-оценки коэффициентов линейной модели множественной регрессии и провести ее исследование.
Провести анализ построенной линейной модели множественной регрессии на наличие/отсутствие мультиколлинеарности; в случае необходимости устранить мультиколлинеарность.

Содержание работы

Введение…………………………………………………………………………6
1 Классическая модель множественной регрессии……………………………..8
1.1 Понятие классической линейной модели множественной регрессии……..8
1.2 Оценка коэффициентов КЛММР методом наименьших квадратов……….9
1.3 Проверка гипотезы о значимости уравнения множественной регрессии…………………...…………………………………………………….10
2 Исследование модели на мультиколлинеарность……………………..…….14
3 Исследование модели на гетероскедастичность…………………………….16
3.1 Понятие гетероскедастичности……………………………………………..16
3.2 Тесты на гетероскедастичность…………………………………………….17
3.2.1 Тест ранговой корреляции Спирмана…………...………………..............17
3.2.2 Тест Голдфелда—Квандта………………………………………………...19
3.3 Несмещенная оценка ковариационной матрицы оценок коэффициентов регрессии………………………………………………………...……………….20
3.3.1 Стандартные ошибки в форме Уайта………………...…………………..20
3.3.2 Стандартные ошибки в форме Ньюи-Веста……………………………...21
4 Исследование модели на наличие автокорреляции регрессионных остатков…………………………………………………………………………..23
Заключение……………………………………………………………………….25
Список использованных источников…………………………………………...26
Приложение А…………………………………………………………………....27

Файлы: 1 файл

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ.docx

— 255.06 Кб (Скачать файл)

Содержание

 

Введение…………………………………………………………………………6

1 Классическая  модель множественной регрессии……………………………..8

1.1 Понятие  классической линейной модели  множественной регрессии……..8

1.2 Оценка  коэффициентов КЛММР методом  наименьших квадратов……….9

1.3 Проверка гипотезы о значимости уравнения множественной регрессии…………………...…………………………………………………….10

2 Исследование  модели на мультиколлинеарность……………………..…….14

3 Исследование модели на гетероскедастичность…………………………….16

3.1 Понятие  гетероскедастичности……………………………………………..16

3.2 Тесты на гетероскедастичность…………………………………………….17

3.2.1 Тест ранговой корреляции Спирмана…………...………………..............17

3.2.2 Тест Голдфелда—Квандта………………………………………………...19

3.3 Несмещенная оценка ковариационной матрицы оценок коэффициентов регрессии………………………………………………………...……………….20

3.3.1 Стандартные ошибки в форме Уайта………………...…………………..20

3.3.2 Стандартные ошибки в форме Ньюи-Веста……………………………...21

4 Исследование  модели на наличие автокорреляции регрессионных остатков…………………………………………………………………………..23

Заключение……………………………………………………………………….25

Список использованных источников…………………………………………...26

Приложение  А…………………………………………………………………....27

 

Введение

 

Эконометрика – это наука, в  которых на базе реальных статистических данных строятся, анализируются и  совершенствуются математические модели экономических явлений (наука, которая  дает количественное выражение взаимосвязей экономических процессов и явлений.

Эконометрика возникла на стыке 3-х  областей знаний: экономической теории, математической экономике и математической статистики.

Предмет эконометрики есть экономические  явления и процессы. Однако, в  отличие от экономической теории, эконометрика делает упор на количественные, а не на качественные аспекты этих явлений. Изучение экономических явлений  в эконометрике осуществляется через  эконометрические модели на базе эмпирических данных.

Цель курсовой работы: исследование влияния социально-экономических показателей на объем инвестиций в основной капитал на душу населения.

Задачами данной работы являются:

  1. Построить МНК-оценки коэффициентов линейной модели множественной регрессии и провести ее исследование.
  2. Провести анализ построенной линейной модели множественной регрессии на наличие/отсутствие мультиколлинеарности; в случае необходимости устранить мультиколлинеарность.
  3. Исследовать регрессионные остатки на наличие гетероскедастичности, используя различные тесты; при необходимости построить ОМНК-оценки параметров регрессионной модели или найти несмещенную оценку ковариационной матрицы вектора оценок коэффициентов в форме Уайта и Невье-Веста.
  4. Исследовать регрессионные остатки на наличие автокорреляции; при необходимости, используя процедуру Кохрейна-Оркатта, построить ОМНК-оценки параметров ОЛММР с автокоррелированными остатками.

Объектом исследования являются 47 муниципальных образований Оренбургской области, характеризующиеся социально-экономическими показателями.

Предметом исследования является количественный аспект социально - экономических явлений.

Исходные данные:

Сведения по 47 муниципальных  образований Оренбургской области, характеризующимся пятью социально-экономическими показателями:

- удельный вес убыточных предприятий и организаций, в процентах от общего числа предприятий;

 – задолженность  организаций по заработной плате, в процентах от общего фонда заработной платы;

- среднегодовая численность работников, занятых в промышленности;

- сальдированный финансовый результат (прибыль минус убыток) на одно предприятие;

- уровень рентабельности реализованной продукции сельского хозяйства в сельскохозяйственных организациях.

 

1 Классическая модель множественной регрессии

 

1.1 Понятие классической линейной  модели множественной регрессии

 

Предположим наличие между результативным и факторными признаками прямой линейной зависимости. Рассмотрим модель множественной регрессии [2]:

  1. ;
  2. – детерминированные величины. Вектора линейно независимы;
  3. – не зависит от;
  4. при i ≠ j – статистическая независимость (некоррелированность) ошибок для разных наблюдений;
  5. Ошибка имеет совместное нормальное распределение: .

Или в матричном виде.

Пусть - вектор наблюдений результирующего признака;

- вектор коэффициентов модели;

 –вектор ошибок;

 – матрица наблюдений факторных признаков.

Тогда модель множественной регрессии  примет вид:

  1. – спецификация модели;
  2. X – детерминированная матрица имеет максимальный ранг;
  3. – дополнительные условия;
  4. , ε –нормально распределенный случайный вектор.

 

 

1.2 Оценка коэффициентов КЛММР  методом наименьших квадратов

 

Целью данного  метода является выбор вектора оценок коэффициентов регрессии , минимизирующего сумму квадратов остатков . Решением данной задач минимизации будет:

 

Найдем  оценки коэффициентов регрессии  методом наименьших квадратов.

Воспользовавшись  стандартными функциями: МУМНОЖ, МОБР программного средства MS Excel вычислим оценки коэффициентов регрессии.

 

Рисунок 1 – Результат вычисления модели

 

Получим следующую модель:

 

 

Данное  уравнение означает, что при увеличении удельного веса убыточных предприятий  и организаций от общего числа  предприятий на 1 процент объем инвестиций в основной капитал на душу населения уменьшиться на 14,265 рублей. В свою очередь при увеличении задолженности  организаций по заработной плате на 1 процент от общего фонда заработной платы уменьшит объем инвестиций в основной капитал на душу населения на 496,958 рубля. Увеличение среднегодовой численности работников, занятых в промышленности на 1 человека увеличит объем инвестиций в основной капитал на душу населения на 0,292 рубля. Увеличение сальдированного финансового результата (прибыль минус убыток) на одно предприятие на 1 рубль увеличит объем инвестиций в основной капитал на душу населения на 0,006 рублей. А увеличение уровня рентабельности реализованной продукции сельского хозяйства в сельскохозяйственных организациях на 1 процент увеличит объем инвестиций в основной капитал на душу населения на 50,46 рублей, соответственно.

 

1.3 Проверка гипотезы о значимости уравнения множественной регрессии

 

Вариацию  зависимой переменной можно разбить  на две части: объясненную регрессионным  уравнением и необъясненную [2]:

 

где

 

 

 

Для определения  качества построенной регрессионной  модели используется коэффициент детерминации:

 

Используя MS Excel получим .

 

Рисунок 2 – Результат вычисления коэффициента детерминации

 

Таким образом, в среднем 81,7% вариации объема инвестиций в основной капитал на душу населения объясняется вариацией выбранных нами факторных признаков, а 18,3% зависит от вариации неучтенных в модели факторов.

Для проверки значимости построенного уравнения  регрессии выдвигается нулевая  гипотеза о том, что линейная модель множественной регрессии не адекватна выборочным данным и альтернативная гипотеза о том, что ЛММР адекватна выборочным данным

Рассмотрим  следующие гипотезы:

(уравнение не  значимо);

 (уравнение значимо).

Для проверки нулевой гипотезы вычислим статистику [1]:

 

распределенную  по закону Фишера с p и с n-p-1 степенями свободы.

Так как, гипотеза о не значимости уравнения регрессии отвергается. Уравнение регрессии значимо.

Проверим  значимость полученных оценок коэффициентов  регрессии при уровне значимости α=0,05. Рассмотрим следующие гипотезы:

 

 

Вычислим  статистику распределенную по закону Стьюдента с k=n-p-1 степенями свободы. Где

 

 

 

Таблица 1. Среднее квадратичное отклонение и t-статистика оценок коэффициентов регрессии

i

   

1

31,43177766

-0,454

2

944,7751317

-0,526

3

0,075791773

3,852

4

0,000555234

11,169

5

47,1932874

1,070


 

 

Условие выполняется только для для остальных регрессоров гипотеза о не значимости коэффициента регрессии принимается.

Построим  доверительный интервал коэффициентов  регрессии. Имеет смысл строить доверительные интервалы только для значимых коэффициентов регрессии и по формуле:

 

Таблица 2. Доверительные интервалы значимых оценок коэффициентов регрессии

i

   

3

0,1389

0,445

4

0,0051

0,0073


 

Таким образом, с вероятностью 0,95 можно предполагать, что увеличение среднегодовой численности работников, занятых в промышленности на 1 человека увеличит объем инвестиций в основной капитал на душу населения в пределах от 0,1389 до 0,445 рублей. А увеличение сальдированного финансового результата (прибыль минус убыток) на одно предприятие на 1 рубль увеличит объем инвестиций в основной капитал на душу населения в пределах от 0,0051 до 0,0073 рублей.

 

2 Исследование модели на мультиколлинеарность

 

Одним из условий классической регрессионной  модели является предположение о  линейной независимости объясняющих  переменных, что означает линейную независимость столбцов матрицы  регрессоров X или (эквивалентно) что  матрица  имеет полный ранг p. При нарушении этого условия, т.е. когда один из столбцов матрицы X есть линейная комбинация остальных столбцов, говорят, что имеет место полная коллинеарность. В этой ситуации нельзя построить МНК-оценку коэффициентов регрессии. Если есть полная коллинеарность, то можно выделить в матрице X максимальную линейно независимую систему столбцов и, удалив остальные столбцы, провести новую регрессию.

На практике полная коллинеарность встречается  исключительно редко. Гораздо чаще приходится сталкиваться с ситуацией, когда матрица X имеет полный ранг, но между регрессорами имеется высокая  степень корреляции, т.е. когда матрица , говоря нестрого, близка к вырожденной. Тогда говорят о наличии мультиколлинеарности. В этом случае МНК-оценка формально существует, но обладает «плохими» свойствами.

Мультиколлинеарность  может возникать в силу разных причин. Например, несколько независимых  переменных могут иметь общий  временной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой  переменной являются лагированными  значениями другой.

Выделим некоторые наиболее характерные  признаки мультиколлинеарности.

1. Небольшое  изменение исходных данных (например, добавление новых наблюдений) приводит  к существенному изменению оценок  коэффициентов модели.

2. Оценки  имеют большие стандартные ошибки, малую значимость, в то время  как модель в целом является  значимой (высокое значение коэффициента  детерминации  и соответствующей F-статистики).

3. Оценки  коэффициентов имеют неправильные  с точки зрения теории знаки  или неоправданно большие значения.

Для выявления  мультиколлинеарности рассчитаем матрицу  парных коэффициентов корреляции по формуле

 

Вычислим  используя MS Excel парные коэффициенты корреляции.

Рисунок 3 - Парные коэффициенты корреляции

 

Коэффициенты детерминации каждой объясняющей переменной на все остальные рассчитанные по формуле:

 

где – определитель матрицы парных коэффициентов, – i-главный минор матрицы парных коэффициентов.

 

 

 

 

 

 

И учитывая, что и, что все парные коэффициенты корреляции между объясняющими признаками достаточно малы, можно сделать вывод об отсутствии мультиколлинеарности между объясняющими признаками.

 

3 Исследование модели на гетероскедастичность

 

3.1 Понятие гетероскедастичности

 

Рассмотрим  обобщенную регрессионную модель с гетероскедастичностью. Этот термин применяется в ситуации, когда матрица ковариаций Ω вектора ошибок ε является диагональной, но элементы главной диагонали, вообще говоря, различны. Иными словами, ошибки в разных наблюдениях некоррелированы, но их дисперсии — разные. (Классическая модель с постоянными дисперсиями ошибок называется гомоскедастичной.) Гетероскедастичность довольно часто возникает, если анализируемые объекты, говоря нестрого, неоднородны. Например, если исследуется зависимость прибыли предприятия от каких-либо факторов, скажем, от размера основного фонда, то естественно ожидать, что для больших предприятий колебание прибыли будет выше, чем для малых.

Информация о работе Классическая модель множественной регрессии