Автор работы: Пользователь скрыл имя, 02 Ноября 2013 в 13:10, лабораторная работа
Задача 7. Влияние уровня экономического развития региона на коэффициент смертности исследуется влияние некоторых показателей социально-экономического положения субъектов Центрального федерального округа России на региональный коэффициент смертности. В табл. 1 приводятся официальные статистические данные по субъектам Центрального федерального округа за 2005 год («Российская газета», 24 марта 2006 года, № 60), где: Y — коэффициент смертности в 2006 году (выражается в промилле «‰» и представляет собой число умерших за год на 1000 человек населения); X1 — индекс (темп роста) промышленного производства, в % к 2004 году; X2 — индекс производства продукции сельского хозяйства, в % к 2004 году (для г. Москвы условно принято 100 %); X3 — численность работников малых предприятий, ‰ (чел. на 1000 чел. населения); X4 — среднемесячная номинальная начисленная заработная плата по региону, тыс. руб.; X5 — численность населения на 1 января 2005 года, тыс. чел.
ОТЧЕТ
по лабораторной работе
по дисциплине «Эконометрика»
Вариант 3
Омск 2013
Влияние уровня экономического развития региона на коэффициент смертности исследуется влияние некоторых показателей социально-экономического положения субъектов Центрального федерального округа России на региональный коэффициент смертности. В табл. 1 приводятся официальные статистические данные по субъектам Центрального федерального округа за 2005 год («Российская газета», 24 марта 2006 года, № 60), где:
Задание:
Примечание. При проверке статистических гипотез уровень значимости a принять равным 0,05.
Некоторые показатели социально-экономического положения субъектов Центрального федерального округа России в 2005 году
Область |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
|
16,0 |
108,8 |
115,8 |
35,4 |
6,86 |
1512 |
|
19,8 |
116,0 |
95,7 |
25,0 |
5,24 |
1346 |
|
20,3 |
100,2 |
113,3 |
43,1 |
6,07 |
1487 |
|
18,8 |
109,6 |
102,1 |
53,3 |
5,60 |
2334 |
|
22,0 |
107,6 |
96,8 |
36,5 |
5,37 |
1115 |
|
19,2 |
105,0 |
94,7 |
58,4 |
6,98 |
1022 |
|
21,0 |
108,4 |
100,3 |
30,1 |
5,84 |
717 |
|
19,7 |
104,0 |
101,1 |
29,8 |
5,65 |
1199 |
|
17,9 |
102,5 |
108,2 |
33,6 |
7,19 |
1190 |
|
17,5 |
129,6 |
101,2 |
61,5 |
9,51 |
6630 |
|
18,5 |
110,3 |
101,7 |
28,4 |
5,46 |
842 |
|
20,3 |
106,2 |
100,9 |
49,4 |
6,22 |
1195 |
|
21,5 |
104,3 |
92,3 |
26,3 |
6,30 |
1019 |
|
19,3 |
102,5 |
110,0 |
25,6 |
5,08 |
1145 |
|
23,1 |
104,4 |
93,0 |
34,5 |
6,64 |
1425 |
|
22,0 |
105,0 |
102,7 |
36,4 |
6,34 |
1622 |
|
19,9 |
104,5 |
105,9 |
43,3 |
7,39 |
1339 |
|
12,4 |
122,4 |
100,0 |
168,9 |
13,74 |
10407 |
Решение
1. Построить матрицу парных коэффициентов линейной корреляции и выявить коллинеарные факторы (коллинеарными считать факторы, коэффициент корреляции между которыми превышает по абсолютной величине 0,7).
Построим матрицу парных коэффициентов корреляции с использованием инструмента Корреляция.
Для проведения корреляционного анализа выполним действия:
Сервис => Анализ данных=>Корреляция.
Рис. 1 Данные для проведение корреляционного анализа.
В диалоговом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные.
Выберем параметры вывода = >ОК (рис 2)
Рис 2. Корреляция.
Рис 3 Матрица парных коэффициентов.
1. Так как Rx1x2 = -0,2 < 0,7 , то x1 и x2 - факторы не коллинеарные;
Rx2x3= -0,07< 0,7, то x2 и x3 - факторы не коллинеарные;
Rx3x4= 0,92> 0,7, то x3 и x4 - факторы коллинеарные
Rx4x5= 0,93> 0,7, то x4 и x5 - факторы коллинеарные
2. а)Как было показано в пункте 1, факторы Х3–Х4, Х4–Х5 являются коллинеарными, а это означает, что они фактически дублируют друг друга, и их одновременное включение в модель приведет к неправильной интерпретации соответствующих коэффициентов регрессии. Видно, что фактор Х4 имеет больший по модулю коэффициент корреляции с результатом Y, чем фактор Х3, Х5 (см. рис. 3). Это свидетельствует о более сильном влиянии фактора Х4 на изменение Y. Фактор Х3, Х5 таким образом, исключается из рассмотрения.
Б) наиболее значимы факторы Х1 и Х5, влияющие на коэффициент смертности.
2.Построить линейную
регрессионную модель
Для проведения регрессионного анализа выполним следующие действия:
1.Сервис => Анализ данных=> Регрессия
2. В диалоговом окне Регрессия в поле Входной интервал Y вводим адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал X вводим адреса диапазонов, которые содержат значения независимых переменных.
3. Выберем параметры вывода =>ОК
Рис 4. Данные для регрессионного анализа 1 модели.
Рис 5, 6 Регрессионный анализ 1 модели
Во втором столбце рисунка 5 содержатся коэффициенты уравнения регрессии. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии 1, а в четвертом – t–статистика, используемая для проверки значимости коэффициентов уравнения регрессии. Уравнения регрессии зависимости у от х можно записать в следующем виде:
Y=51,66-0,10Х1-0,16Х2-0,67Х4
Т.к. наиболее значимы факторы Х1 и Х5, влияющие на коэффициент смертности, построим вторую модель.
Рис 7. Данные для регрессионного анализа 2 модели.
Рис 8, 9 Регрессионный анализ 2 модели
Во втором столбце рисунка 5 содержатся коэффициенты уравнения регрессии. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии 2, а в четвертом – t–статистика, используемая для проверки значимости коэффициентов уравнения регрессии. Уравнения регрессии зависимости у от х можно записать в следующем виде:
Y=20,28+0,006Х1-0,0007Х5
3.Проверить
статистическую значимость
Оценка статистической значимости уравнения регрессии в целом осуществляется по F–критерию Фишера. Если Fрасч. > Fтабл. – уравнение статистически значимо.
Табличное значение F-критерия Фишера находим с помощью функции FРАСПОБР.
Рис 10.
Так как Fрасч. > Fтабл. (20,28 > 3,29), то уравнение регрессии 1 можно признать значимым (адекватным).
Табличное значение t-критерия Стьюдента находим с помощью функции СТЬЮДРАСПОБР.
Расчетное значение t-критерия Стьюдента находим по формуле:
Оценим значимость факторов с помощью t–критерия Стьюдента, для этого, определим его табличное значение при уровне значимости 0,05.
к =n-m-1=18-2-1=15
t-кр.таб=2,13
Сравним расчетные значения с табличным по модулю:
│t X1 =1,67│< tтабл. = 2,13, следовательно фактор X1 –– не является значимым.
│t X2=3,07│> tтабл. = 2,13, следовательно фактор X2 –– является значимым.
│t X4=3,08 │>tтабл. = 2,13, следовательно фактор X4 –является значимым.
Значение коэффициента детерминации можно найти в таблице Регрессионная статистика.
Коэффициент детерминации:
= 1-
R2 = 0,73
То есть 73% изменения результата Y (коэффициент смертности) происходит под влиянием факторов Х1, Х2, Х4 .
Определим среднюю относительную ошибку аппроксимации из таблицы Вывод остатка:
= =5,89
В среднем расчетные значения Y для линейной модели отличаются от фактических значений на 5,89 %.
Вывод: Х1— индекс (темп роста) промышленного производства, в % к 2004 году - не существенно влияет на коэффициент смертности, Х2- индекс производства продукции сельского хозяйства, в % к 2004, Х4— среднемесячная номинальная начисленная заработная плата по региону, тыс. руб. - существенно влияют на коэффициент смертности. Модель Y=51,66-0,10Х1-0,16Х2-0,67Х4 является хорошей, т.к. у нее большой коэффициент детерминации (R2 = 0,73 → 1), статистически значимой (Fрасч >Fтабл), достаточно точной.
Найдем значение F-критерия Фишера и значение t-критерия Стьюдента для 2 уравнения:
Рис 11.
Так как Fрасч. > Fтабл. (8,46> 3,68), то уравнение регрессии 2 можно признать значимым (адекватным).
Оценим значимость факторов с помощью t–критерия Стьюдента, для этого, определим его табличное значение при уровне значимости 0,05.
к =n-m-1=18-2-1=15
t-кр.таб=2,13
Сравним расчетные значения с табличным по модулю:
│t X1 =0,067│< tтабл. = 2,13, следовательно фактор X1 –– не является значимым.
│t X5=2,63│> tтабл. = 2,13, следовательно фактор X5 –– является значимым.
Значение коэффициента детерминации можно найти в таблице Регрессионная статистика.
Коэффициент детерминации:
= 1-
R2 = 0,53
То есть 53% изменения результата Y (коэффициент смертности) происходит под влиянием факторов Х1, Х5 .
Определим среднюю относительную ошибку аппроксимации из таблицы Вывод остатка:
= =6,67
В среднем расчетные значения Y для линейной модели отличаются от фактических значений на 6,67 %.
Вывод: Х1— индекс (темп роста) промышленного производства, в % к 2004 году- не существенно влияет на коэффициент смертности, Х5 — численность населения на 1 января 2005 года, тыс. чел. - существенно влияет на коэффициент смертности. Модель Y=20,28+0,006Х1-0,0007Х5 является хорошей, т.к. у нее большой коэффициент детерминации (R2 = 0,53 → 1), статистически значимой (Fрасч >Fтабл), достаточно точной.
Модель Y=51,66-0,10Х1-0,16Х2-
4. Дать экономическую интерпретацию параметров лучшего уравнения регрессии и оценить вклад каждого из факторов в вариацию коэффициента смертности с помощью дельта – коэффициентов.
Для оценки степени влияния каждой из групп факторов на смертность используются 3 коэффициента (коэффициенты эластичности, β-коэффициенты, ∆-коэффициенты).
1) Коэффициент эластичности рассчитывается по формуле:
Полученные значения представлены на рисунке 12. Коэффициент эластичности Эхj показывает, на сколько % изменится зависимая переменная Y при изменение фактора Xj на 1%.
Эх1= 0,56 – при изменение Х1 на 1% Y (коэффициент смертности) изменится на 0,56%.
Эх2= 0, 0,84 – при изменение Х2 на 1% Y изменится на 0,84%.
Эх4= 0,23 – при изменение Х4 на 1% Y (коэффициент смертности) изменится на 0,23%.