Фиктивные переменные в регрессионном анализе

Автор работы: Пользователь скрыл имя, 03 Апреля 2014 в 18:10, контрольная работа

Описание работы

Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В литературе можно встретить термины «структурные переменные» или «искусственные переменные»
Например, в результате опроса группы людей 0 может означать, что опрашиваемый — мужчина, а 1 — женщина. К фиктивным переменным иногда относят регрессор, состоящий из одних единиц (т.е. константу, свободный член), а также временной тренд.

Файлы: 1 файл

эконометрика.docx

— 52.06 Кб (Скачать файл)

              БАЛТИЙСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ им. И. КАНТА

                       Экономический факультет

                   Кафедра Экономики и финансов

 

Курсовая работа допущена к защите                                   Курсовая работа защищена на:

"____"_________________ 201__г.                                       _____________________________

                   (дата)                                                                                                           (оценка)

                                                                                              "____"    ______________ 201___г.

                                                                                                                                       (дата)

Руководитель                                                                        Руководитель _________________ _________________________________                              _____________________________                             ________________________________                                _____________________________

                (фамилия, имя, отчество)                                                            (фамилия, имя, отчество)

 

 

                    

                      Контрольная работа подисциплине

                                     « эконометрика»

 

 


 

                                                                                                 

 

 

 

                                            

                                            

                                             Калининград  2014 г.

Вариант 12

              Фиктивные переменные в регрессионном анализе

Термин “фиктивные переменные” используется как противоположность “значащим” переменным, показывающим уровень количественного показателя, принимающего значения из непрерывного интервала. Как правило, фиктивная переменная — это индикаторная переменная, отражающая качественную характеристику. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В литературе можно встретить термины «структурные переменные» или «искусственные переменные» 
       Например, в результате опроса группы людей 0 может означать, что опрашиваемый — мужчина, а 1 — женщина. К фиктивным переменным иногда относят регрессор, состоящий из одних единиц (т.е. константу, свободный член), а также временной тренд. 
 
     Использование фиктивных переменных в моделях с временными рядами 
В регрессионных моделях с временными рядами используется три основных вида фиктивных переменных: 
         1) Переменные-индикаторы принадлежности наблюдения к определенному периоду — для моделирования скачкообразных структурных сдвигов. Границы периода (моменты “скачков”) должны быть установлены из априорных соображений. Например, 1, если наблюдение принадлежит периоду 1941-45 гг. и 0 в противном случае. Это пример использования для моделирования временного структурного сдвига. Постоянный структурный сдвиг моделируется переменной равной 0 до определенного момента времени и 1 для всех наблюдений после этого момента времени. 
         2) Сезонные переменные — для моделирования сезонности. Сезонные переменные принимают разные значения в зависимости от того, какому месяцу или кварталу года или какому дню недели соответствует наблюдение. 
         3) Линейный временной тренд — для моделирования постепенных плавных структурных сдвигов. Эта фиктивная переменная показывает, какой промежуток времени прошел от некоторого “нулевого” момента времени до того момента, к которому относится данное наблюдение (координаты данного наблюдения на временной шкале). Если промежутки времени между последовательными наблюдениями одинаковы, то временной тренд можно составить из номеров наблюдений. 
 
Временной тренд отличается от бинарных фиктивных переменных тем, что имеет смысл использовать его степени: t2 , t3 и т. д. Они помогают моделировать гладкий, но нелинейный тренд. (Бинарную переменную нет смысла возводить в степень, потому что в результате получится та же самая переменная.) Можно также комбинировать указанные виды фиктивных переменных, создавая переменные “взаимодействия” соответствующих эффектов. 
Комбинация рассмотренных фиктивных переменных позволяет моделировать еще один эффект — изменение наклона тренда с определенного момента. Помимо тренда в регрессию следует тогда ввести следующую переменную: в начале выборки до некоторого момента времени она равна 0, а вторая ее часть представляет собой временной тренд (1, 2, 3 и т. д. в случае одинаковых интервалов между наблюдениями). 
 
Использование фиктивных переменных имеет следующие преимущества: 
        1) Интервалы между наблюдениями не обязательно должны быть одинаковыми. В выборке могут быть пропущенные наблюдения.                                                        

        2)Коэффициенты  при фиктивных переменных легко  интерпретировать, они наглядно  представляют структуру динамического  процесса.

         3)Для оценивания модели не приходится выходить за рамки классического метода наименьших квадратов.

Рассмотрим применение фиктивных переменных для функции спроса.

Предположим, что по группе лиц мужского и женского пола изучается

линейная зависимость потребления кофе от цены. В общем виде для

совокупности обследуемых уравнение регрессии имеет вид:

y = a + bx +e ,

где y – количество потребляемого кофе; x – цена.

Аналогичные уравнения могут быть найдены отдельно для лиц

мужского пола: y1 = a 1 + b 1 x 1 + e 1 и женского пола: y2 = a 2+ b 2x2 +e2

Различия в потреблении кофе проявятся в различии средних y1 и y2 .


Вместе с тем сила влияния x на y может быть одинаковой, т.е. b » b1 »b2 .

В этом случае возможно построение общего уравнения регрессии с

включением в него фактора «пол» в виде фиктивной переменной. Объединяя

уравнения 1 y и 2 y и, вводя фиктивные переменные, можно прийти к

следующему выражению:

                      y = a1z1 + a2 z2 + bx +e

где 1 z и 2 z – фиктивные переменные, принимающие значения:

 1-мужской пол                       0-мужской пол        


z1= 0-женский пол     z2=      1-женский пол

 

В общем уравнении регрессии зависимая переменная y

рассматривается как функция не только цены x но и пола (z1 , z2 ).

Переменная z рассматривается как дихотомическая переменная,

принимающая всего два значения: 1 и 0. При этом когда z1 =1, то z2 = 0, и

наоборот.

          Для лиц мужского пола, когда z1 =1 и z2 = 0, объединенное

уравнение регрессии составит: y1 = a + bx , а для лиц женского пола, когда

z1 = 0 и z2= 1: y = a2 + bx . Иными словами, различия в потреблении для

лиц мужского и женского пола вызваны различиями свободных членов

уравнения регрессии: a1 ≠a2 . Параметр b является общим для всей

совокупности лиц, как для мужчин, так и для женщин.

Однако при введении двух фиктивных переменных z1 и z2 в модель

 y = a1 z1 + а 2z2 + bx +ᶓ применение МНК для оценивания параметров a1 и

a2 приведет к вырожденной матрице исходных данных, а следовательно, и к

невозможности получения их оценок. Объясняется это тем, что при

использовании МНК в данном уравнении появляется свободный член, т.е.

уравнение примет вид 

                                y = A+ a1z1 + a2z2 + bx +e

Предполагая при параметре A независимую переменную, равную 1,

имеем следующую матрицу исходных данных:

 

1 1  0 x1


1 1  0  x2

1 0   1  x3

1   1   0  x4

... ... ... ...

1 0  1 xn

 

 

В рассматриваемой матрице существует линейная зависимость между

первым, вторым и третьим столбцами: первый равен сумме второго и

третьего столбцов. Поэтому матрица исходных факторов вырождена.

Выходом из создавшегося затруднения может явиться переход к уравнениям

 y = A+ A1 z1 + bx +e  или y = A+ A2 z2 + bx +e ,

т.е. каждое уравнение включает только одну фиктивную переменную z1 или

 z2 .

Предположим, что определено уравнение

y = A+ A1 z1 + bx +e , где  z1 принимает значения 1 для мужчин и 0 для женщин.

Теоретические значения размера потребления кофе для мужчин будут

получены из уравнения

 

 ŷ = A+ A1 + bx.

 

Для женщин соответствующие значения получим из уравнения

ŷ = A + bx .

Сопоставляя эти результаты, видим, что различия в уровне

потребления мужчин и женщин состоят в различии свободных членов

данных уравнений: A – для женщин и A + A1 – для мужчин.

Теперь качественный фактор принимает только два состояния,

которым соответствуют значения 1 и 0. Если же число градаций

81

качественного признака-фактора превышает два, то в модель вводится

несколько фиктивных переменных, число которых должно быть меньше

числа качественных градаций. Только при соблюдении этого положения

матрица исходных фиктивных переменных не будет линейно зависима и

возможна оценка параметров модели.

 

 

 

 

 

                                      Задача 12   

Имеются следующие данные по 15 заводам отрасли, полученные в результате проведения 5%-ной случайной бесповторной выборки.

Номер завода

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Объем промышленной продукции, млн руб.

10

9

12

11

14

8

7

15

13

16

 

  20

 

  17

 

    6

 

  18

 

  19

Среднегодовая стоимость производственных фондов, млн руб.

7

5

10

8

17

6

6

20

12

20

 

 

22

 

 

21

 

 

5

 

 

21

 

 

22


 

 

Взаимосвязь между стоимостью производственных фондов (х) и объемом промышленной продукции (у) характеризуется уравнением:

у(х )= 6,13 + 0,48х.

Провести тесты на гомоскедатичность по критерию Спирмэна.

 

 

 

Решение:

Исходные данные: X (стоимость производственных фондов), Y (объем промышленной продукции).

В таблице 1. представлены значения признаков X и Y:

X

Y

1

7

10

2

5

9

3

10

12

4

8

11

5

17

14

6

6

8

7

6

7

8

20

15

9

12

13

10

20

16

11

22

20

12

21

17

13

5

6

14

21

18

15

22

19


 

 

Для удобства представим данные в упрядоченном виде с помощью программы excel (Данные->Сортировка->Сортировать по возрастанию)

Имеем таблицу 2.

X

Y

2

5

9

13

5

6

6

6

8

7

6

7

1

7

10

4

8

11

3

10

12

9

12

13

5

17

14

8

20

15

10

20

16

12

21

17

14

21

18

11

22

20

15

22

19


 

 

  1. Рассчитываем Y(x) по формуле из условия у(х )= 6,13 + 0,48х.

Теперь можем найти (y-yx), все значения вносятся в таблицу.

  1. Проранжируем данные в порядке возрастания значений (самому) маленькому элементу присвоим ранг 1 и т. д. до самого большого элемента последовательности, который получит ранг m)

Результаты ранжирования представлены в таблице 3.:

X

Y

 

Y(x)

 

ᶓ(y-yx)

ранг, Ry

ранг,

Rᶓ

разность рангов D, Rx-Rᶓ

                         D2

2

5

9

8,53

0,47

      4

    5

-1

1

13

5

6

8,53

-2,53

      1

    1

  0

0

6

6

8

  9,01

-1,01

      3

    3

  0

0

7

6

7

9,01

-2,01

      2

    2

  0

0

1

7

10

9,49

0,51

      5

    6

-1

1

4

8

11

9,97

1,03

      6

    8

-2

4

3

10

12

10,93

1,07

      7

    9

-2

4

9

12

13

11,89

1,11

      8

   10

-2

4

5

17

14

14,29

   0,29

      9

    4

  5

25

8

20

15

15,73

0,73

     10

    7

  3

9

10

20

16

15,73

1,73

     11

   12

-1

1

12

21

17

16,21

1,21

     12

   11

  1

1

14

21

18

16,21

2,21

     13

   13

  0

0

11

22

20

16,69

3,31

     15

   15

  0

0

15

22

19

16,69

2,31

     14

   14

  0

0

Информация о работе Фиктивные переменные в регрессионном анализе