Анализ факторов динамики валового регионального продукта

Автор работы: Пользователь скрыл имя, 11 Января 2014 в 19:56, курсовая работа

Описание работы

Целью данной работы является нахождение динамики и зависимости данных валового регионального продукта от факторов, влияющих на его изменение. Для достижения этой цели ставилось несколько задач. Прежде всего, необходимо было выявить факторы, оказывающие наиболее существенное влияние на конечный показатель валового регионального продукта, для решения этой задачи рассчитывались коэффициенты корреляции и отбирались наиболее значимые из них. После этого, необходимо было построить многофакторную модель изменения валового регионального продукта, проверить эту модель на адекватность и оценить точность прогноза. Следующим шагом было построение тренда

Содержание работы

Введение 3
Глава 1. Теория статистического исследования валового регионального продукта 5
1.1 Валовой региональный продукт: понятие, факторы изменения 5
1.2 Обоснование необходимости оценки валового продукта по регионам Российской Федерации. Структура ВРП 11
1.3 Статистические методы исследования ВРП 17
Глава 2. Анализ факторов и прогноз валового регионального продукта (за период с 2001 года по 2010 год) 29
2.1 Подготовка временных рядов к анализу: визуализация и предварительная обработка данных 29
2.2 Построение многофакторной корреляционной модели и проверка ее на адекватность 31
2.3 Трендовая модель прогнозирования ВРП и оценка качества прогноза 34
Заключение 38
Список литературы 39

Файлы: 1 файл

КУРСАК.docx

— 206.54 Кб (Скачать файл)

Целью корреляционного анализа  является выявление статистически  существенной связи между результирующим показателем Y и факторным признаком Xк и выявлением направления такой  зависимости. Для этого рассчитываются парные коэффициенты корреляции (1) и  определяются их уровни значимости.

       (1)

где x и y – значения факторного и результирующего признаков соответственно

σx и σy – среднеквадратические отклонения признаков

Парный коэффициент корреляции изменяется в пределах от -1 до1 и  показывает тесноту связи между  факторным признаком и результирующим показателем. Для проверки значимости этого коэффициента необходимо выдвинуть  две гипотезы (2). Гипотеза H0 предполагает, что генеральный коэффициент отличается от нуля несущественно, следовательно, статистически значимой связи между X и Y нет, либо она очень слабая. Гипотеза H1 предполагает, что генеральный коэффициент корреляции отличается от нуля существенно, следовательно, существует статистически значимая связь между X и Y.

           (2)

После этого необходимо рассчитать значение статистики Стьюдента (3) и  сравнить его с табличным значением. Если расчетное значение статистики Стьюдента больше табличного, то говорим  о том, что коэффициент корреляции отличается от нуля существенно и  является значимым на уровне определенном уровне значимости. В противоположном  случае говорим, что коэффициент  корреляции не значим.

          (3)

Целью регрессионного анализа является оценка функциональной зависимости  условного среднего значения результативного  признака (У) от факторных (Х1, Х2, ..., Хк).

Основной предпосылкой регрессионного анализа является то, что только результативный признак (У) подчиняется  нормальному закону распределения, а факторные признаки Х1, Х2, ..., Хк могут иметь произвольный закон  распределения. При этом в регрессионном  анализе заранее подразумевается  наличие причинно-следственных связей между результативным (У) и факторными (Х1, Х2, ..., Хк) признаками.

Уравнение регрессии, или статистическая модель связи массовых процессов  и явлений, выражаемая функцией У(x) = F (Х1, Х2, ..., Хк) + ε.

Множественной (или многофакторной) регрессией называется изучение связи  между тремя и более связанными между собой признаками.

Этапы построения множественной регрессии:

- выбор формы связи (уравнения  регрессии);

- отбор факторных признаков;

- обеспечение достаточного объема  совокупности для получения несмещенных  оценок.

Для построения уравнения множественной  регрессии необходимо выбрать признаки, имеющие наибольший парный коэффициент  корреляции с Y. В случае линейной регрессии  необходимо рассчитать оценки параметров уравнения регрессии с помощью  линейного метода наименьших квадратов (4).

          (4)

В общем виде оценки параметров уравнения  регрессии рассчитываются по формуле  .

После построения уравнения регрессии  необходимо проверить значимость коэффициентов  регрессии и уравнения регрессии  в целом.

Для проверки значимости коэффициентов  регрессии выдвигается две гипотезы H0 и H1.

Гипотеза H0 предполагает, что параметры уравнения несущественно отличаются от нуля. Гипотеза H1 предполагает, что параметры уравнения существенно отличаются от нуля, следовательно, они значимы в уравнении регрессии. Рассчитываем значение статистики Стьюдента (5) и сравниваем его с табличным значением. Если расчетное значение больше табличного, то говорим о том, что данный параметр уравнения регрессии значим на определенном уровне значимости, в противном случае говорим о том, что этот коэффициент регрессии не значим.

           (5),

где

Для проверки значимости уравнения  регрессии в целом тоже необходимо выдвинуть две теории. Нулевая  теория будет означать, что все  параметры уравнения отличаются от нуля несущественно, а первая гипотеза будет означать, что существует хотя бы один параметр уравнения регрессии, существенно отличающийся от нуля.

После этого расчетное значение статистики Фишера (6) сравниваем с табличным. Если расчетное значение статистики Фишера превышает табличное, то принимаем  первую гипотезу и говорим о том, что уравнение регрессии значимо  в целом на заданном уровне значимости, в противоположном случае утверждаем, что уравнение регрессии не значимо  в целом.

          (6)

После проверки значимости параметров уравнения и уравнения регрессии  в целом необходимо рассчитать коэффициент  детерминации (7), который показывает долю вариации Y, объясненную построенным  уравнением регрессии.

         (7)

После этого, если построенная модель является адекватной и имеет высокое  качество можно переходить к прогнозированию.

Другим методом исследования валового регионального продукта является построение трендовой модели. Эта модель имеет  свои особенности, так как единственным фактором, влияющим на результирующий показатель, будет время. Кроме того, наблюдения во временной выборке  должны быть расположены в строго определенной последовательности. Как  правило наблюдения во временной  выборки зависимы, и во многом предопределены порождающим ряд явлением. Таким  образом, временным рядом называют упорядоченную по времени последовательность наблюдений.

В общем виде модель временного ряда выглядит следующим образом yt=f(t)+εt. Где f(t) является детерминированной составляющей модели и описывает влияние основного фактора – времени, а εt является случайной компонентой, наличие которой обусловлено присутствием второстепенных неучтенных в модели факторов. Валовой региональный продукт имеет долгосрочную тенденцию, поэтому для описания его изменения во времени целесообразнее использовать кривые достаточно гладких форм или полиномы невысоких степеней. В некоторых ситуациях, когда тренд просматривается явно, но, тем не менее, его невозможно описать простой функций времени применяют процедуры сглаживания. Эти процедура так же называют фильтрованием, а оператор, который их осуществляет – фильтром. Суть всех сглаживающих методов заключается в замене фактического значения ряда yt на некоторую взвешенную среднюю величину значений временного ряда , наблюдаемых в окрестности этой точки. Расчетные значения  определяют для всех наблюдений ряда за исключением нескольких начальных и конечных моментов времени. Применяют разные виды операторов фильтров: линейные, экспоненциальные и другие. Преимуществом сглаживающих процедур  является их гибкость, простота, не столь строгие требования к качеству исходной информации. Однако, необходимо помнить, что данные методы не обладают четкими статистическими свойствами, а получаемые статистические выводы ограничены, потому что эти методы не имеют под собой строгой вероятностной модели. Таким образом, недостатками сглаживающих методов является  невозможность указать доверительные области и проверить гипотезы относительно тренда, нельзя непосредственно связать построенную функцию с моделью образования тренда. Кроме того, методы сглаживания не позволяют получить оценки тренда для q начальных и s конечных значений, если сглаживание проводят на четном числе членов в интервале, то оценка тренда будет находиться между двумя средними точками, что бывает не слишком удобно, и наконец, вследствие того, что тренд не оценивают для последних s моментов времени, экстраполяция тренда не всегда возможна. Использование методов сглаживания в большей степени подходит для целей описания временного ряда и получения краткосрочных прогнозов, чем для его анализа.

В большинстве случаев члены  временного ряда являются статистически  зависимыми друг от друга, это значит, что значение переменной в момент времени t во многом определяются значениями этой же переменной в предшествующие моменты времени t-1, t-2 и т. д. в связи с этим необходимо говорить о явлении автокорреляции уровней временного ряда.

Для проверки наличия автокорреляции уровней ряда рассчитывается коэффициент  автокорреляции, который показывает степень зависимости уровней  исследуемого ряда от предыдущих уровней  этого же ряда, отстающих от него на τ моментов во времени. Эту величину τ называют временным лагом, он характеризует  период запаздывания yt относительно yt-τ.

В общем виде коэффициента корреляции рассчитывается по формуле

, где

yt и yt+τ – значения фактического и смещенного во времени рядов соответственно

τ – значение временного лага

В процессе расчетов коэффициента автокорреляции временной лаг не должен превышать  величины Т/4 для больших временных  выборок и Т/10 для малых. Это  ограничение вызвано тем, что  с увеличением временного лага уменьшается  число пар наблюдений.

Коэффициент автокорреляции изменяется в пределах от -1 до 1. Значение, приближенное по модулю к единице говорит о  высокой коррелированности уровней  ряда, значение коэффициента авторегрессии, приближенное к нулю, говорит об отсутствии связи между уровнями ряда.

Совокупность значений коэффициентов  с разными лагами образует выборочную автокорреляционную функцию, а представленная на графике функция rτ называется коррелограммой

Валовой региональный продукт –  ряд, содержащий долгосрочную тенденцию. следовательно, все значения коэффициентов  положительны и первый коэффициент rτ достаточно большой, а все последующие имеют плавную тенденцию к снижению.

Основная особенность коррелирования временных показателей связана  с автокорреляцией уровней ряда. Присутствие автокорреляции искажает картину взаимосвязи признаков. Если уровни рядов автокоррелированы, то корреляционный анализ исходных наблюдений следует дополнить анализом значений временных рядов очищенных от автокорреляции.

Один из способов устранения автокорреляции заключается в удалении тренда из временного ряда. В этом случае коррелируют  не сами уровни рядов, а их отклонения от трендов. Тренд может быть  выделен путем аналитического выравнивания или одним из методов сглаживания. После удаления тренда необходимо убедиться  в отсутствии автокорреляции в отклонениях. Формула коэффициента корреляции по отклонениям от трендов имеет  вид

, где

хt, Yt  - фактические значения показателей

, -детерминированная составляющая  трендовой модели

- возмущения трендовой модели.

В качестве этих оценок выступают  отклонения  наблюдений от оцененной  линии трендов. При этом следует  убедиться в отсутствии автокорреляции в остатках.

Второй способ удаления автокорреляции из временных рядов - вычисление последовательных разностей. Пусть хt, Yt  временные ряды, а - первые разности (от последующего наблюдения отнимаем предыдущее с соответствующим шагом t=2,3,…T). Для них коэффициент корреляции последовательных разностей определяют как:

Корреляция последовательных разностей  более эффективна для рядов, включающих краткосрочные корреляции уровней. Для подобных временных рядов  удаление трендов не всегда дает хорошие  результаты, иногда при удалении тренда автокорреляция сохраняется в остатках. Вычисление последовательных разностей  позволяет освободить временные  ряды от автокорреляции.

Построение регрессионных зависимостей по временным рядам встречает  две основных проблемы. Первая возникает  в связи с высокой коррелированностью уровней временных показателей, включающих тренды. Высока вероятность  мультиколлинеарности объясняющих  переменных в регрессионной модели. Решение этой проблемы связано с  использованием пошаговых процедур отбора факторов.

Вторая проблема сопряжена с  появлением автокорреляции в остаточной компоненте регрессионной модели. Если модель построена на пространственной выборке, то независимость остатков означает, что случайные возмущения или помехи на одном объекте не оказывают влияния на случайные  возмущения на другом объекте. Для временных  выборок это условие подразумевает  независимость временной последовательности остатков.

Лаговая корреляция рассматривается  в ситуациях, связанных с запаздыванием, когда влияние одного показателя на другой проявляется с некоторым  интервалом времени. Этот временной  интервал также называют запаздыванием  или временным лагом. Для лаговых  зависимостей используется стандартная  техника корреляционного и регрессионного анализа, но при условии, что временные  ряды сдвинуты относительно друг друга  на величину τ. При этом число взаимосвязанных  наблюдений уменьшится на τ.

 

Глава 2. Анализ факторов и прогноз валового регионального продукта (за период с 2001 года по 2010 год)

2.1 Подготовка временных  рядов к анализу: визуализация  и предварительная обработка  данных

Для анализа  на практике с помощью статистических методов рассмотрим показатели государственной  статистики о социально-экономическом  положении Российской Федерации  в 2001-2010 годах. Данные были взяты с сайта Федеральной службы государственной статистики, при этом были выбраны ежегодные показатели за десять лет (таблица №1).

Таблица 1- Факторы, влияющие на величину ВРП

Сибирский федеральный округ

ВРП (млн. руб.)

Номинальная заработная плата (руб.)

Инвестиции в основной капитал (млн. руб.)

Незанятые (тыс.чел.)

Спрос на труд (чел.)

Объем платных услуг (млн. руб.)

 

Y

X1

X2

X3

X4

X5

2010

3491449,3

15381.4

895248

269,8

104322

418796

2009

3 027 504.4

12344.8

684659.7

296

156824

356180.1

2008

2 442 999.2

9877.5

483721.4

348.5

115824

290223

2007

1 951 299.4

8109.7

346105.1

346.8

96039

238750

2006

1 631 782.5

6507.8

255399.2

362.8

81766

187242

2005

1 209 596.7

5325.3

193613.8

320.8

79741

152600

2004

991 736.7

4309.5

150109,0

297.4

71709

118985

2003

844 142.2

3190.8

135116,0

249.4

79555

84621

2002

687 070.8

2269.6

98647,0

196.9

63890

64508

2001

467 359.8

1559.5

61875,0

216.6

44773

48543

Информация о работе Анализ факторов динамики валового регионального продукта