Автор работы: Пользователь скрыл имя, 28 Апреля 2015 в 13:26, сочинение
Целью данного исследования является: во-первых, рассмотрение основных факторов, влияющих на объем инновационного потенциала для субъектов РФ, и во-вторых, анализ полученной модели и определение прогнозных оценок развития НИОКР в России.
1. Введение………………………………………………………………………………… 3
2. Анализ данных…………………………………………………………………………. 4
a. Источник данных………………………………………………………………. 4
b. Описание переменных…………………………………………………………. 5
c. Описательная статистика ……………………………………………………… 6
d. Выбросы…………………………………………………………………………..7
3. Теоретическая модель………………………………………………………………….10
a. Взаимосвязь переменных………………………………………………………10
b. Матрица корреляций, ожидаемые знаки коэффициентов…………………...11
c. Анализ мультиколлинеарности………………………………………………..12
d. Графики, предполагаемые функциональные связи…………………………..14
4. Выбор модели……………………………………………………………………….......15
a. Правдоподобные знаки, значимость регрессии в целом……………………..15
b. Гистограмма остатков, гетероскедастичность ……………………………….16
c. Верная/неверная спецификация модели, значимость коэффициентов, скорректированный R2........................................................................................16
5. Анализ выбранной модели……………………………………………………………..20
a. Интерпретация коэффициентов……………………………………………….20
b. Тест Вальда ……………………………………………………………………..20
c. Доверительные интервалы……………………………………………………..21
d. Прогнозирование ………………………………………………………………21
6. Заключение……………………………………………………………………………...23
7. Список литературы……………………………………………………………………..24
8. Приложение №1………………………………………………………………………...25
Приложение №2………………………………………………………………………...28
Приложение №3………………………………………………………………………...29
Приложение №4………………………………………………………………………...30
Приложение №5………………………………………………………………………...31
Приложение №6………………………………………………………………………...32
Приложение №7………………………………………………………………………...33
Приложение №8…………………………………………………………………….......34
Приложение №9………………………………………………………………………...35
По данной таблице можно утверждать, что с вероятностью 0,0000 <5% оценка коэффициента firms является значимой. Значение R2 = 0,713692, DW = 2,086944. Теперь внесем поправку в модель, заменив параметр firms на scientists.
Как показано в Таблице №4 оценка коэффициента scientists является также значимой с вероятностью Prob = 0,0000 <5%. Коэффициент детерминации R2=0,660713 и R2adj = 0,641325 ухудшился по сравнению с прежним результатом. Значение Durbin-Watson stat = 2,078346.
Dependent Variable: VOLUME |
||||
Method: Least Squares |
||||
Date: 05/06/14 Time: 12:17 |
||||
Sample: 1 80 IF FUNDING<300000000 AND VOLUME<2500000 | ||||
Included observations: 75 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
85315.82 |
36244.65 |
2.353887 |
0.0214 |
TECHNOLOGY |
82.35751 |
16.10615 |
5.113421 |
0.0000 |
STATUS |
-121902.8 |
108530.4 |
-1.123214 |
0.2652 |
FUNDING |
0.000298 |
0.000599 |
0.497750 |
0.6202 |
SCIENTISTS |
14.94173 |
3.426011 |
4.361262 |
0.0000 |
R-squared |
0.660713 |
Mean dependent var |
310620.5 | |
Adjusted R-squared |
0.641325 |
S.D. dependent var |
353235.8 | |
S.E. of regression |
211551.1 |
Akaike info criterion |
27.42666 | |
Sum squared resid |
3.13E+12 |
Schwarz criterion |
27.58116 | |
Log likelihood |
-1023.500 |
Hannan-Quinn criter. |
27.48835 | |
F-statistic |
34.07871 |
Durbin-Watson stat |
2.078346 | |
Prob(F-statistic) |
0.000000 |
|||
Построим следующую пробную модель объема инновационных товаров, работ и услуг, заменив scientists на costs.
Результаты новой пробной модели представлены в Таблице №5. В результате внесения поправки в модель, видно, что оценка коэффициента costs также является значимой с вероятностью = 0,0000<5%. Но в данном случае качество подгонки R2 = 0,664252, R2adj=0,645067 уменьшилось, что хуже объясняет регрессию по сравнению с моделью, в которой был включен регрессор количества организаций (firms). Durbin-Watson stat остается практически неизменным во всех трех пробных моделях.
Dependent Variable: VOLUME |
||||
Method: Least Squares |
||||
Date: 05/01/14 Time: 20:36 |
||||
Sample: 1 80 IF VOLUME<2500000 AND FUNDING<300000000 | ||||
Included observations: 75 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
92941.86 |
36354.18 |
2.556566 |
0.0127 |
TECHNOLOGY |
83.28640 |
15.83445 |
5.259823 |
0.0000 |
STATUS |
-97304.35 |
105436.9 |
-0.922868 |
0.3592 |
FUNDING |
0.000275 |
0.000596 |
0.460455 |
0.6466 |
COSTS |
13.98184 |
3.129634 |
4.467565 |
0.0000 |
R-squared |
0.664252 |
Mean dependent var |
310620.5 | |
Adjusted R-squared |
0.645067 |
S.D. dependent var |
353235.8 | |
S.E. of regression |
210444.7 |
Akaike info criterion |
27.41617 | |
Sum squared resid |
3.10E+12 |
Schwarz criterion |
27.57067 | |
Log likelihood |
-1023.107 |
Hannan-Quinn criter. |
27.47786 | |
F-statistic |
34.62249 |
Durbin-Watson stat |
2.054455 | |
Prob(F-statistic) |
0.000000 |
|||
Таким образом, по результатам полученных данных, в рассматриваемой модели, регрессор firms необходимо оставить неизменным, так как он наилучшим образом описывает данную модель, параметр costs прологарифмировать (genr ncosts=log(costs)), а у регрессора scientists создать новую линейную комбинацию (genr nscientists = 1/scientists). Тем самым мы избавились от мультиколлинеарности. Результаты корреляционной матрицы итоговой регрессионной модели представлены в Приложении №2.
Анализ предполагаемых
Выбор модели
Прежде чем проводить анализ итоговой регрессионной модели, необходимо исследовать пробную модель на эффективность оценок коэффициентов. Для начала построим модель для того чтобы проверить регрессию и знаки коэффициентов на значимость (Таблица №6).
ls volume c technology status funding firms ncosts nscientists
Dependent Variable: VOLUME |
||||
Method: Least Squares |
||||
Date: 05/06/14 Time: 12:51 |
||||
Sample: 1 80 IF FUNDING<300000000 AND VOLUME<2500000 | ||||
Included observations: 75 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-218992.6 |
142989.6 |
-1.531528 |
0.1303 |
TECHNOLOGY |
73.06693 |
15.44840 |
4.729742 |
0.0000 |
STATUS |
-193267.3 |
102814.1 |
-1.879775 |
0.0644 |
FUNDING |
0.000156 |
0.000550 |
0.283546 |
0.7776 |
FIRMS |
3999.883 |
888.1294 |
4.503716 |
0.0000 |
NCOSTS |
38895.50 |
22431.90 |
1.733937 |
0.0875 |
NSCIENTISTS |
2578780. |
4143983. |
0.622295 |
0.5358 |
R-squared |
0.725907 |
Mean dependent var |
310620.5 | |
Adjusted R-squared |
0.701722 |
S.D. dependent var |
353235.8 | |
S.E. of regression |
192919.0 |
Akaike info criterion |
27.26661 | |
Sum squared resid |
2.53E+12 |
Schwarz criterion |
27.48291 | |
Log likelihood |
-1015.498 |
Hannan-Quinn criter. |
27.35298 | |
F-statistic |
30.01517 |
Durbin-Watson stat |
2.145356 | |
Prob(F-statistic) |
0.000000 |
|||
Данная таблица показывает, что нулевая гипотеза о значимости регрессии в целом отклоняется: Н0: β1=β2=...=0. Регрессионное уравнение в целом значимо на уровне значимости 5%, и вариация независимых переменных объясняет вариацию зависимой переменной в регрессионном уравнении, так как Prob (F-statistic) = 0,0000 <5%. Все коэффициенты регрессии кроме параметров technology и firms незначимы, поскольку больше 5%. Что касается знаков коэффициентов, то они получились не такие, как мы ожидали: административный статус федерального округа отрицательно влияют на объем инновационных товаров, работ и услуг. Все остальные знаки выглядят вполне правдоподобно, так как между независимыми переменными и зависимой переменной существует прямая положительная связь.
Так как полученная модель не является временной, то нет необходимости проводить тест на проверку автокорреляции остатков в модели.
Для того чтобы посмотреть существует ли смещение оценок стандартных ошибок параметров регрессии, вызванных гетероскедастичностью необходимо построить гистограмму остатков, которая представлена на Графике №6.
Гистограмма остатков показывает нам то, что степень разброса остатков непостоянна, есть области с большими по модулю остатками (высокая дисперсия) и области со средними по модулю остатками (невысокая дисперсия). Существует подозрение на наличие гетероскедастичности. Чтобы понять присутствует ли в остатках гетероскедастичность, проведем тест Уайта. Основная гипотеза теста Уайта выглядит следующим образом:
H0: σ12=…=σn2 гомоскедастичность
H1: гетероскедастичность
В Приложении №6 представлены результаты проверки гипотезы об отсутствии гетероскедастичности с помощью теста Уайта. Так как Prob. F(26,48) = 0,9306, Prob. Chi-Square (26) = 0,8770, то нулевая гипотеза о наличии гомоскедастичности не отклоняется на любом разумном уровне значимости. Следовательно, оценки коэффициентов и стандартных ошибок коэффициентов не смещены, нет гетероскедастичности в данной модели.
Так как в рассматриваемой модели (ls volume c technology status funding firms ncosts nscientists) оценки коэффициентов оказались незначимыми, то необходимо трансформировать уравнение регрессии. В качестве зависимой переменной введем следующую линейную комбинацию: genr nvolume = volume*volume и из рассматриваемой модели исключим регрессор nscientists (Таблица №7).