Лабораторная работа по "Эконометрике"

Автор работы: Пользователь скрыл имя, 02 Ноября 2013 в 13:10, лабораторная работа

Описание работы

Задача 7. Влияние уровня экономического развития региона на коэффициент смертности исследуется влияние некоторых показателей социально-экономического положения субъектов Центрального федерального округа России на региональный коэффициент смертности. В табл. 1 приводятся официальные статистические данные по субъектам Центрального федерального округа за 2005 год («Российская газета», 24 марта 2006 года, № 60), где: Y — коэффициент смертности в 2006 году (выражается в промилле «‰» и представляет собой число умерших за год на 1000 человек населения); X1 — индекс (темп роста) промышленного производства, в % к 2004 году; X2 — индекс производства продукции сельского хозяйства, в % к 2004 году (для г. Москвы условно принято 100 %); X3 — численность работников малых предприятий, ‰ (чел. на 1000 чел. населения); X4 — среднемесячная номинальная начисленная заработная плата по региону, тыс. руб.; X5 — численность населения на 1 января 2005 года, тыс. чел.

Файлы: 1 файл

задание № 7.doc

— 1.47 Мб (Скачать файл)

 

 

 

 

 

 

ОТЧЕТ

по лабораторной работе

по дисциплине «Эконометрика»

Вариант 3

 

 

 

 

 

 

                                                                    

 

 

 

 

 

 

 

 

 

 

Омск 2013

Задача 7.

Влияние уровня экономического развития региона на коэффициент смертности исследуется влияние некоторых показателей социально-экономического положения субъектов Центрального федерального округа России на региональный коэффициент смертности. В табл. 1 приводятся официальные статистические данные по субъектам Центрального федерального округа за 2005 год («Российская газета», 24 марта 2006 года, № 60), где:

  • Y — коэффициент смертности в 2006 году (выражается в промилле «‰» и представляет собой число умерших за год на 1000 человек населения);
  • X1 — индекс (темп роста) промышленного производства, в % к 2004 году;
  • X2 — индекс производства продукции сельского хозяйства, в % к 2004 году (для г. Москвы условно принято 100 %);
  • X3 — численность работников малых предприятий, ‰ (чел. на 1000 чел. населения);
  • X4 — среднемесячная номинальная начисленная заработная плата по региону, тыс. руб.;
  • X5 — численность населения на 1 января 2005 года, тыс. чел.

Задание:

  1. Построить матрицу парных коэффициентов линейной корреляции и выявить коллинеарные факторы (коллинеарными считать факторы, коэффициент корреляции между которыми превышает по абсолютной величине 0,7).
  2. Построить линейную регрессионную модель коэффициента смертности, обосновав отбор факторов. Если из-за коллинеарности факторов невозможно построить уравнение регрессии с полным перечнем факторов, то построить несколько моделей, включающих в себя как минимум три фактора.
  3. Проверить статистическую значимость уравнений регрессии и их параметров. Сделать выводы о существенности либо несущественности влияния факторов на коэффициент смертности. Сравнить качество моделей.
  4. Дать экономическую интерпретацию параметров лучшего уравнения регрессии и оценить вклад каждого из факторов в вариацию коэффициента смертности с помощью дельта – коэффициентов.

Примечание. При проверке статистических гипотез уровень значимости a принять равным 0,05.

Некоторые показатели социально-экономического положения субъектов Центрального федерального округа России в 2005 году

Область 

Y

X1

X2

X3

X4

X5

  1. Белгородская

16,0

108,8

115,8

35,4

6,86

1512

  1. Брянская

19,8

116,0

95,7

25,0

5,24

1346

  1. Владимирская

20,3

100,2

113,3

43,1

6,07

1487

  1. Воронежская

18,8

109,6

102,1

53,3

5,60

2334

  1. Ивановская

22,0

107,6

96,8

36,5

5,37

1115

  1. Калужская

19,2

105,0

94,7

58,4

6,98

1022

  1. Костромская

21,0

108,4

100,3

30,1

5,84

717

  1. Курская

19,7

104,0

101,1

29,8

5,65

1199

  1. Липецкая

17,9

102,5

108,2

33,6

7,19

1190

  1. Московская

17,5

129,6

101,2

61,5

9,51

6630

  1. Орловская

18,5

110,3

101,7

28,4

5,46

842

  1. Рязанская

20,3

106,2

100,9

49,4

6,22

1195

  1. Смоленская

21,5

104,3

92,3

26,3

6,30

1019

  1. Тамбовская

19,3

102,5

110,0

25,6

5,08

1145

  1. Тверская

23,1

104,4

93,0

34,5

6,64

1425

  1. Тульская

22,0

105,0

102,7

36,4

6,34

1622

  1. Ярославская

19,9

104,5

105,9

43,3

7,39

1339

  1. г. Москва

12,4

122,4

100,0

168,9

13,74

10407


 

 

 

Решение

1. Построить матрицу парных коэффициентов линейной корреляции и выявить коллинеарные факторы (коллинеарными считать факторы, коэффициент корреляции между которыми превышает по абсолютной величине 0,7).

Построим матрицу парных коэффициентов корреляции с использованием инструмента Корреляция.

Для проведения корреляционного анализа выполним действия:

Сервис => Анализ данных=>Корреляция.

Рис. 1 Данные для проведение корреляционного анализа.

В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные.

Выберем параметры  вывода = >ОК (рис 2)

Рис 2. Корреляция.

Рис 3 Матрица  парных коэффициентов.

1. Так как Rx1x2 = -0,2 < 0,7 , то x1 и x2 - факторы не коллинеарные;

Rx2x3= -0,07< 0,7, то x2 и x3 - факторы не коллинеарные;

Rx3x4= 0,92> 0,7, то x3 и x4 - факторы коллинеарные

Rx4x5= 0,93> 0,7, то x4 и x5 - факторы коллинеарные

2. а)Как было показано в пункте 1, факторы Х3–Х4, Х4–Х5 являются коллинеарными, а это означает, что они фактически дублируют друг друга, и их одновременное включение в модель приведет к неправильной интерпретации соответствующих коэффициентов регрессии. Видно, что фактор Х4 имеет больший по модулю коэффициент корреляции с результатом Y, чем фактор Х3, Х5 (см. рис. 3). Это свидетельствует о более сильном влиянии фактора Х4 на изменение Y. Фактор Х3, Х5 таким образом, исключается из рассмотрения.

Б) наиболее значимы факторы Х1 и Х5, влияющие на коэффициент смертности.

2.Построить линейную  регрессионную модель коэффициента  смертности, обосновав отбор факторов. Если из-за коллинеарности факторов невозможно построить уравнение регрессии с полным перечнем факторов, то построить несколько моделей, включающих в себя как минимум три фактора.

Для проведения регрессионного анализа выполним следующие действия:

1.Сервис => Анализ данных=> Регрессия

2.  В диалоговом  окне Регрессия в поле Входной интервал Y вводим адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X вводим адреса диапазонов, которые содержат значения независимых переменных.

3.    Выберем параметры вывода =>ОК

Рис 4. Данные для регрессионного анализа 1 модели.

Рис 5, 6 Регрессионный  анализ 1 модели

Во втором столбце  рисунка 5 содержатся коэффициенты уравнения регрессии. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии 1, а в четвертом – t–статистика, используемая для проверки значимости коэффициентов уравнения регрессии.  Уравнения регрессии зависимости у от х можно записать в следующем виде:

Y=51,66-0,10Х1-0,16Х2-0,67Х4

Т.к. наиболее значимы  факторы Х1 и Х5, влияющие на коэффициент смертности, построим вторую модель.

Рис 7. Данные для регрессионного анализа 2 модели.

Рис 8, 9 Регрессионный анализ 2 модели

Во втором столбце  рисунка 5 содержатся коэффициенты уравнения регрессии. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии 2, а в четвертом – t–статистика, используемая для проверки значимости коэффициентов уравнения регрессии.  Уравнения регрессии зависимости у от х можно записать в следующем виде:

Y=20,28+0,006Х1-0,0007Х5

 

3.Проверить  статистическую значимость уравнений  регрессии и их параметров. Сделать  выводы о существенности либо  несущественности влияния факторов на коэффициент смертности. Сравнить качество моделей.

Оценка статистической значимости уравнения регрессии в целом осуществляется по F–критерию Фишера. Если Fрасч. > Fтабл. – уравнение статистически значимо.

Табличное значение F-критерия Фишера находим с помощью функции FРАСПОБР.

Рис 10.

Так как Fрасч. > Fтабл. (20,28  > 3,29), то уравнение регрессии 1 можно признать значимым (адекватным).

Табличное значение t-критерия Стьюдента находим с помощью функции СТЬЮДРАСПОБР.

Расчетное значение t-критерия Стьюдента находим по формуле:

Оценим значимость факторов с помощью t–критерия Стьюдента, для этого, определим его табличное значение при уровне значимости 0,05.

 к =n-m-1=18-2-1=15

t-кр.таб=2,13

Сравним расчетные значения с табличным по модулю:

│t X1 =1,67│<  tтабл. = 2,13, следовательно фактор X1 –– не является значимым.

│t X2=3,07│> tтабл. = 2,13, следовательно фактор X2 –– является значимым.

│t X4=3,08 │>tтабл. = 2,13, следовательно фактор X4 –является значимым.

Значение коэффициента детерминации можно найти в таблице Регрессионная статистика.

Коэффициент детерминации:

                = 1-

R2 = 0,73

То есть 73%  изменения результата Y (коэффициент смертности) происходит под влиянием факторов Х1, Х2, Х4 .

Определим  среднюю  относительную ошибку  аппроксимации из таблицы Вывод остатка:

                      = =5,89

В среднем расчетные  значения Y для линейной модели отличаются от фактических значений на 5,89 %.

Вывод: Х1— индекс (темп роста) промышленного производства, в % к 2004 году - не существенно влияет на коэффициент смертности, Х2- индекс производства продукции сельского хозяйства, в % к 2004, Х4— среднемесячная номинальная начисленная заработная плата по региону, тыс. руб. - существенно влияют на коэффициент смертности. Модель Y=51,66-0,10Х1-0,16Х2-0,67Х4 является хорошей, т.к. у нее большой коэффициент детерминации (R2 = 0,73 → 1), статистически значимой (Fрасч >Fтабл), достаточно точной.

 

Найдем значение F-критерия Фишера и значение t-критерия Стьюдента для 2 уравнения:

Рис 11.

Так как Fрасч. > Fтабл. (8,46> 3,68), то уравнение регрессии 2 можно признать значимым (адекватным).

Оценим значимость факторов с помощью t–критерия Стьюдента, для этого, определим его табличное значение при уровне значимости 0,05.

 к =n-m-1=18-2-1=15

t-кр.таб=2,13

Сравним расчетные значения с табличным по модулю:

│t X1 =0,067│<  tтабл. = 2,13, следовательно фактор X1 –– не является значимым.

│t X5=2,63│> tтабл. = 2,13, следовательно фактор X5 –– является значимым.

Значение коэффициента детерминации можно найти в таблице Регрессионная статистика.

Коэффициент детерминации:

                = 1-

R2 = 0,53

 

То есть 53%  изменения результата Y (коэффициент смертности) происходит под влиянием факторов Х1, Х5 .

Определим  среднюю  относительную ошибку  аппроксимации  из таблицы Вывод остатка:

                      = =6,67

В среднем расчетные  значения Y для линейной модели отличаются от фактических значений на 6,67 %.

Вывод: Х1— индекс (темп роста) промышленного производства, в % к 2004 году- не существенно влияет на коэффициент смертности, Х5 —  численность населения на 1 января 2005 года, тыс. чел. - существенно влияет на коэффициент смертности. Модель Y=20,28+0,006Х1-0,0007Х5 является хорошей, т.к. у нее большой коэффициент детерминации (R2 = 0,53 → 1), статистически значимой (Fрасч >Fтабл), достаточно точной.

Модель Y=51,66-0,10Х1-0,16Х2-0,67Х4 является лучшей.

4. Дать экономическую  интерпретацию параметров лучшего уравнения регрессии и оценить вклад каждого из факторов в вариацию коэффициента смертности с помощью дельта – коэффициентов.

Для оценки степени влияния  каждой из групп факторов на смертность используются 3 коэффициента (коэффициенты эластичности,             β-коэффициенты, ∆-коэффициенты).

1) Коэффициент эластичности рассчитывается по формуле:

Полученные значения представлены на рисунке 12. Коэффициент эластичности Эхj показывает, на сколько % изменится зависимая переменная Y при изменение фактора Xj на 1%.

Эх1= 0,56 – при изменение Х1 на 1% Y (коэффициент смертности) изменится на 0,56%.

Эх2= 0, 0,84 – при изменение Х2 на 1% Y изменится на 0,84%.

Эх4= 0,23 – при изменение Х4 на 1% Y (коэффициент смертности) изменится на 0,23%.

Информация о работе Лабораторная работа по "Эконометрике"