Автор работы: Пользователь скрыл имя, 28 Апреля 2015 в 13:26, сочинение
Целью данного исследования является: во-первых, рассмотрение основных факторов, влияющих на объем инновационного потенциала для субъектов РФ, и во-вторых, анализ полученной модели и определение прогнозных оценок развития НИОКР в России.
1. Введение………………………………………………………………………………… 3
2. Анализ данных…………………………………………………………………………. 4
a. Источник данных………………………………………………………………. 4
b. Описание переменных…………………………………………………………. 5
c. Описательная статистика ……………………………………………………… 6
d. Выбросы…………………………………………………………………………..7
3. Теоретическая модель………………………………………………………………….10
a. Взаимосвязь переменных………………………………………………………10
b. Матрица корреляций, ожидаемые знаки коэффициентов…………………...11
c. Анализ мультиколлинеарности………………………………………………..12
d. Графики, предполагаемые функциональные связи…………………………..14
4. Выбор модели……………………………………………………………………….......15
a. Правдоподобные знаки, значимость регрессии в целом……………………..15
b. Гистограмма остатков, гетероскедастичность ……………………………….16
c. Верная/неверная спецификация модели, значимость коэффициентов, скорректированный R2........................................................................................16
5. Анализ выбранной модели……………………………………………………………..20
a. Интерпретация коэффициентов……………………………………………….20
b. Тест Вальда ……………………………………………………………………..20
c. Доверительные интервалы……………………………………………………..21
d. Прогнозирование ………………………………………………………………21
6. Заключение……………………………………………………………………………...23
7. Список литературы……………………………………………………………………..24
8. Приложение №1………………………………………………………………………...25
Приложение №2………………………………………………………………………...28
Приложение №3………………………………………………………………………...29
Приложение №4………………………………………………………………………...30
Приложение №5………………………………………………………………………...31
Приложение №6………………………………………………………………………...32
Приложение №7………………………………………………………………………...33
Приложение №8…………………………………………………………………….......34
Приложение №9………………………………………………………………………...35
Следующий регрессор, характеризующий внутренние затраты на научные исследования и разработки (costs) представляет собой фактические затраты на выполнение исследований и разработок на территории страны и выражен в денежной форме, млн. рублей. Данный показатель попал в данную группу, поскольку помимо собственных затрат организаций он включает финансирование из-за рубежа, то есть взаимодействие с различными агентами, но исключает выплаты, сделанные за рубежом. Основным источником финансирования инновационной деятельности российских промышленных предприятий остается их собственные средства, доля которых имеет тенденцию к росту (если в период с 1995г. по 1998г.она составляла в среднем 80%, то в период с 1999г. по 2003г. она возросла до 86%, а показатель 2003 г. составил 91%) [7].
Для начала анализа данных
необходимо рассмотреть
VOLUME |
TECHNOLOGY |
STATUS |
SCIENTISTS |
FIRMS |
FUNDING |
COSTS | |
Mean |
449305.4 |
2395.775 |
0.100000 |
9078.975 |
44.57500 |
49414371 |
8748.376 |
Median |
203624.8 |
1395.500 |
0.000000 |
1661.000 |
21.00000 |
10540190 |
1187.500 |
Maximum |
4691972. |
17948.00 |
1.000000 |
234345.0 |
710.0000 |
1.12E+09 |
245646.1 |
Minimum |
2561.771 |
11.00000 |
0.000000 |
19.00000 |
1.000000 |
1001.990 |
34.90000 |
Std. Dev. |
732700.5 |
3133.636 |
0.301893 |
29068.34 |
89.13491 |
1.42E+08 |
30341.43 |
Skewness |
3.807787 |
2.832089 |
2.666667 |
6.362542 |
5.826937 |
5.826981 |
6.473206 |
Kurtosis |
19.98208 |
12.14533 |
8.111111 |
47.36607 |
41.39836 |
42.01165 |
48.67621 |
Jarque-Bera |
1154.627 |
385.7332 |
181.8930 |
7100.920 |
5367.490 |
5525.744 |
7513.085 |
Probability |
0.000000 |
0.000000 |
0.000000 |
0.000000 |
0.000000 |
0.000000 |
0.000000 |
Sum |
35944434 |
191662.0 |
8.000000 |
726318.0 |
3566.000 |
3.95E+09 |
699870.1 |
Sum Sq. Dev. |
4.24E+13 |
7.76E+08 |
7.200000 |
6.68E+10 |
627657.5 |
1.59E+18 |
7.27E+10 |
Observations |
80 |
80 |
80 |
80 |
80 |
80 |
80 |
По результатам данной таблицы можно судить о том, что распределение всех переменных отличается от гауссового, это следует из статистики Jarque-Bera, основанной на следующей гипотезе:
H0: Skewness=0, Kurtosis=3
H1: Skewness ≠0, Kurtosis≠3.
Так как, в данном случае Skewness = 3,807787, Kurtosis = 19,98208, то нулевая гипотеза о нормальном распределении отклоняется. Также, следует отметить, что отсутствуют ошибки в данных.
Средний объем инновационных товаров, услуг и работ в выборке - 449 305,4 млн. руб., минимальное и максимальное значения – 2 561,771 и 4 691 972 млн. руб. соответственно.
Среднее количество ученых в выборке составляет – 9079 человек, минимальное и максимальное значение соответственно равны – 19 и 234 345 человек, а также среднее количество организаций - 55, минимальное и максимальное значения равны 1 и 710, следовательно, выборка охватывает огромный диапазон человеческого капитала, вовлеченного в инновационный процесс.
Административный статус имеет достаточно незначительное среднее значение (0,1), так как в РФ сформировано 8 федеральных округов, что означает наличие восьми основных центров, принимающих значение 1.
Среднее значение по собственным затратам составляет 8 748,376 млн. руб., минимальное и максимальное значения соответственно равны 34,9 и 245 646,1 млн. руб., а среднее значения показателя, отражающего финансовую поддержку со стороны государства равно 49 414 371 рублей, минимальное и максимальное значения составляют 1001,99 и 1 115 806 196 рублей. Исходя из полученных значений можно судить о том, что собственные средства в значительной мере превышают показатель финансирования из средств государственного бюджета. Таким образом, поддержка инноваций и науки со стороны государства ограничивается только высокими словами о их значимости для общества.
Теперь проанализируем наличие выбросов в данных. Что касается количественных переменных: volume, costs, scientists, firms, technology, funding, то все они не подчиняются правилу, согласно которому минимальное и максимальное значения должны входить в интервал «среднее плюс-минус три стандартных отклонения». Но так как эти переменные не измеряются непосредственно, но являются расчётными характеристиками процесса, то данное правило не работает. Но для того, чтобы окончательно решить исключать наблюдения или нет, необходимо обратиться к графику №1. На графике видно, что переменная volume содержит выброс, поэтому добавим условие volume <3 000 000, что позволяет подчиняться правилу: минимальное и максимальное значения должны входить в интервал «среднее плюс-минус три стандартных отклонения». Также для регрессора funding добавим условие <300 000 000.
На графике №2 представлены переменные volume и funding без выбросов.
В
дополнение необходимо
Для того, чтобы приблизить эмпирическое распределение к гауссовому, можно исключить еще один выброс в переменной volume (Например: volume <2 500 000). В результате количество наблюдений осталось прежним (как и в случае volume<3 000 000), коэффициент скошенности уменьшился с 3,807787 (показатель представлен в Таблице №1) до 2,097430, как показано на Графике №4. Таким образом, гипотеза о нормальном распределении отклоняется на любом уровне значимости. В целом скошенное и островершинное распределение переменных volume, costs, technology, scientists, funding, firms не противоречат реальности, так как данные охватывают различные субъекты РФ.
Теоретическая модель
Рассмотрение теоретической модели необходимо начать с выявления зависимости между регрессорами. Для этого построим диаграмму рассеивания для независимых переменных costs, technology, scientists, firms, funding и status, отложив по горизонтали зависимую переменную volume. Результаты представлены на Графике №5.
По данным графикам выявлены следующие зависимости: между независимыми переменными и зависимой переменной volume существует прямая положительная зависимость, т.е., чем больше собственных затрат, тем больше объем инновационных товаров, работ и услуг; чем больше организаций и ученых, имеющих научную степень задействовано в инновационном процессе, тем больше они производят инновационные товары, работы и услуги; чем больше государство участвует в инновационной деятельности субъектов РФ, тем больший результат имеет инновационный потенциал; чем больше организации и ученные используют различные технологии, тем больше получают объем инновационных товаров, работ и услуг. Что касается качественной переменной - административного статуса, то в данном случае объем инновационных товаров, работ и услуг принимает большее значение в центрах федеральных округов. В целом эти наблюдения не противоречат здравому смыслу, т.е. данные выглядят правдоподобно.
Далее рассмотрим матрицу корреляций, представленную в Таблице №2, с помощью которой проверим коэффициенты корреляции на значимость и определим ожидаемые знаки коэффициентов.
Covariance Analysis: Ordinary |
||||||||
Date: 04/27/14 Time: 15:20 |
||||||||
Sample: 1 80 |
||||||||
Included observations: 75 |
||||||||
Correlation |
||||||||
Probability |
VOLUME |
TECHNOLOGY |
STATUS |
SCIENTISTS |
FUNDING |
FIRMS |
COSTS |
|
VOLUME |
1.000000 |
|||||||
----- |
||||||||
TECHNOLOGY |
0.744266 |
1.000000 |
||||||
0.0000 |
----- |
|||||||
STATUS |
0.438561 |
0.518353 |
1.000000 |
|||||
0.0001 |
0.0000 |
----- |
||||||
SCIENTISTS |
0.730578 |
0.665769 |
0.615987 |
1.000000 |
||||
0.0000 |
0.0000 |
0.0000 |
----- |
|||||
FUNDING |
0.139811 |
0.043598 |
0.075708 |
0.196555 |
1.000000 |
|||
0.2316 |
0.7103 |
0.5186 |
0.0910 |
----- |
||||
FIRMS |
0.745539 |
0.595425 |
0.636252 |
0.941100 |
0.213593 |
1.000000 |
||
0.0000 |
0.0000 |
0.0000 |
0.0000 |
0.0658 |
----- |
|||
COSTS |
0.728783 |
0.647098 |
0.580300 |
0.992725 |
0.203805 |
0.920505 |
1.000000 |
|
0.0000 |
0.0000 |
0.0000 |
0.0000 |
0.0795 |
0.0000 |
----- |
||
Независимые переменные значимо (на любом
разумном уровне значимости) коррелируют
с зависимой переменной, кроме регрессора funding (Prob.= 0,2316 >5%). Что
касается ожидаемых знаков коэффициентов,
то они все оправдались: technology, scientists, funding, firms, costs,
status положительно коррелируют с зависимой
переменной volume. Как и ожидалось в
центрах федеральных округов (status=1) производится больший
объем инновационных товаров, работ и
услуг, чем в отдаленных субъектах РФ (status=0). Что касается корреляции
между независимыми переменными, то она
является вполне высокой, но значимой
на 5% уровне значимости. Объем инновационных
товаров, работ и услуг с большей степенью
коррелирует с такими параметрами как:
собственные затраты, количество организаций,
вовлеченных в инновационный процесс
и используемые технологии. Переменная funding не коррелирует со
всеми переменными (Prob.>5%).
Исходя из результатов, полученных в таблице №2, между переменными scientists и firms, scientists и costs, firms и costs присутствует мультиколлинеарность, так как корреляция больше 75%. Необходимо избавиться от мультиколлинераности, иначе МНК-оценки параметров будут иметь большие стандартные ошибки и малую значимость. Для того, чтобы определить какой параметр более оптимален для модели (firms, scientists или costs), какой необходимо преобразовать, используя различные линейные комбинации, необходимо построить пробные модели.
Для
начала построим пробную
ls volume c technology status funding firms
Dependent Variable: VOLUME |
||||
Method: Least Squares |
||||
Date: 05/01/14 Time: 20:35 |
||||
Sample: 1 80 IF VOLUME<2500000 AND FUNDING<300000000 | ||||
Included observations: 75 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
19091.11 |
33510.20 |
0.569711 |
0.5707 |
TECHNOLOGY |
85.20549 |
13.83429 |
6.159007 |
0.0000 |
STATUS |
-213838.0 |
102793.0 |
-2.080277 |
0.0412 |
FUNDING |
0.000106 |
0.000552 |
0.192732 |
0.8477 |
FIRMS |
4717.970 |
791.9210 |
5.957626 |
0.0000 |
R-squared |
0.713692 |
Mean dependent var |
310620.5 | |
Adjusted R-squared |
0.697332 |
S.D. dependent var |
353235.8 | |
S.E. of regression |
194333.7 |
Akaike info criterion |
27.25688 | |
Sum squared resid |
2.64E+12 |
Schwarz criterion |
27.41138 | |
Log likelihood |
-1017.133 |
Hannan-Quinn criter. |
27.31857 | |
F-statistic |
43.62303 |
Durbin-Watson stat |
2.086944 | |
Prob(F-statistic) |
0.000000 |
|||