Автор работы: Пользователь скрыл имя, 11 Января 2014 в 19:56, курсовая работа
Целью данной работы является нахождение динамики и зависимости данных валового регионального продукта от факторов, влияющих на его изменение. Для достижения этой цели ставилось несколько задач. Прежде всего, необходимо было выявить факторы, оказывающие наиболее существенное влияние на конечный показатель валового регионального продукта, для решения этой задачи рассчитывались коэффициенты корреляции и отбирались наиболее значимые из них. После этого, необходимо было построить многофакторную модель изменения валового регионального продукта, проверить эту модель на адекватность и оценить точность прогноза. Следующим шагом было построение тренда
Введение 3
Глава 1. Теория статистического исследования валового регионального продукта 5
1.1 Валовой региональный продукт: понятие, факторы изменения 5
1.2 Обоснование необходимости оценки валового продукта по регионам Российской Федерации. Структура ВРП 11
1.3 Статистические методы исследования ВРП 17
Глава 2. Анализ факторов и прогноз валового регионального продукта (за период с 2001 года по 2010 год) 29
2.1 Подготовка временных рядов к анализу: визуализация и предварительная обработка данных 29
2.2 Построение многофакторной корреляционной модели и проверка ее на адекватность 31
2.3 Трендовая модель прогнозирования ВРП и оценка качества прогноза 34
Заключение 38
Список литературы 39
Целью корреляционного анализа является выявление статистически существенной связи между результирующим показателем Y и факторным признаком Xк и выявлением направления такой зависимости. Для этого рассчитываются парные коэффициенты корреляции (1) и определяются их уровни значимости.
(1)
где x и y – значения факторного и результирующего признаков соответственно
σx и σy – среднеквадратические отклонения признаков
Парный коэффициент корреляции
изменяется в пределах от -1 до1 и
показывает тесноту связи между
факторным признаком и
(2)
После этого необходимо рассчитать значение статистики Стьюдента (3) и сравнить его с табличным значением. Если расчетное значение статистики Стьюдента больше табличного, то говорим о том, что коэффициент корреляции отличается от нуля существенно и является значимым на уровне определенном уровне значимости. В противоположном случае говорим, что коэффициент корреляции не значим.
(3)
Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (Х1, Х2, ..., Хк).
Основной предпосылкой регрессионного
анализа является то, что только
результативный признак (У) подчиняется
нормальному закону распределения,
а факторные признаки Х1, Х2, ..., Хк
могут иметь произвольный закон
распределения. При этом в регрессионном
анализе заранее
Уравнение регрессии, или статистическая модель связи массовых процессов и явлений, выражаемая функцией У(x) = F (Х1, Х2, ..., Хк) + ε.
Множественной (или многофакторной) регрессией называется изучение связи между тремя и более связанными между собой признаками.
Этапы построения множественной регрессии:
- выбор формы связи (уравнения регрессии);
- отбор факторных признаков;
- обеспечение достаточного
Для построения уравнения множественной регрессии необходимо выбрать признаки, имеющие наибольший парный коэффициент корреляции с Y. В случае линейной регрессии необходимо рассчитать оценки параметров уравнения регрессии с помощью линейного метода наименьших квадратов (4).
(4)
В общем виде оценки параметров уравнения регрессии рассчитываются по формуле .
После построения уравнения регрессии
необходимо проверить значимость коэффициентов
регрессии и уравнения
Для проверки значимости коэффициентов
регрессии выдвигается две
Гипотеза H0 предполагает, что параметры уравнения несущественно отличаются от нуля. Гипотеза H1 предполагает, что параметры уравнения существенно отличаются от нуля, следовательно, они значимы в уравнении регрессии. Рассчитываем значение статистики Стьюдента (5) и сравниваем его с табличным значением. Если расчетное значение больше табличного, то говорим о том, что данный параметр уравнения регрессии значим на определенном уровне значимости, в противном случае говорим о том, что этот коэффициент регрессии не значим.
(5),
где
Для проверки значимости уравнения регрессии в целом тоже необходимо выдвинуть две теории. Нулевая теория будет означать, что все параметры уравнения отличаются от нуля несущественно, а первая гипотеза будет означать, что существует хотя бы один параметр уравнения регрессии, существенно отличающийся от нуля.
После этого расчетное значение
статистики Фишера (6) сравниваем с табличным.
Если расчетное значение статистики
Фишера превышает табличное, то принимаем
первую гипотезу и говорим о том,
что уравнение регрессии
(6)
После проверки значимости параметров
уравнения и уравнения
(7)
После этого, если построенная модель является адекватной и имеет высокое качество можно переходить к прогнозированию.
Другим методом исследования валового регионального продукта является построение трендовой модели. Эта модель имеет свои особенности, так как единственным фактором, влияющим на результирующий показатель, будет время. Кроме того, наблюдения во временной выборке должны быть расположены в строго определенной последовательности. Как правило наблюдения во временной выборки зависимы, и во многом предопределены порождающим ряд явлением. Таким образом, временным рядом называют упорядоченную по времени последовательность наблюдений.
В общем виде модель временного ряда выглядит следующим образом yt=f(t)+εt. Где f(t) является детерминированной составляющей модели и описывает влияние основного фактора – времени, а εt является случайной компонентой, наличие которой обусловлено присутствием второстепенных неучтенных в модели факторов. Валовой региональный продукт имеет долгосрочную тенденцию, поэтому для описания его изменения во времени целесообразнее использовать кривые достаточно гладких форм или полиномы невысоких степеней. В некоторых ситуациях, когда тренд просматривается явно, но, тем не менее, его невозможно описать простой функций времени применяют процедуры сглаживания. Эти процедура так же называют фильтрованием, а оператор, который их осуществляет – фильтром. Суть всех сглаживающих методов заключается в замене фактического значения ряда yt на некоторую взвешенную среднюю величину значений временного ряда , наблюдаемых в окрестности этой точки. Расчетные значения определяют для всех наблюдений ряда за исключением нескольких начальных и конечных моментов времени. Применяют разные виды операторов фильтров: линейные, экспоненциальные и другие. Преимуществом сглаживающих процедур является их гибкость, простота, не столь строгие требования к качеству исходной информации. Однако, необходимо помнить, что данные методы не обладают четкими статистическими свойствами, а получаемые статистические выводы ограничены, потому что эти методы не имеют под собой строгой вероятностной модели. Таким образом, недостатками сглаживающих методов является невозможность указать доверительные области и проверить гипотезы относительно тренда, нельзя непосредственно связать построенную функцию с моделью образования тренда. Кроме того, методы сглаживания не позволяют получить оценки тренда для q начальных и s конечных значений, если сглаживание проводят на четном числе членов в интервале, то оценка тренда будет находиться между двумя средними точками, что бывает не слишком удобно, и наконец, вследствие того, что тренд не оценивают для последних s моментов времени, экстраполяция тренда не всегда возможна. Использование методов сглаживания в большей степени подходит для целей описания временного ряда и получения краткосрочных прогнозов, чем для его анализа.
В большинстве случаев члены временного ряда являются статистически зависимыми друг от друга, это значит, что значение переменной в момент времени t во многом определяются значениями этой же переменной в предшествующие моменты времени t-1, t-2 и т. д. в связи с этим необходимо говорить о явлении автокорреляции уровней временного ряда.
Для проверки наличия автокорреляции уровней ряда рассчитывается коэффициент автокорреляции, который показывает степень зависимости уровней исследуемого ряда от предыдущих уровней этого же ряда, отстающих от него на τ моментов во времени. Эту величину τ называют временным лагом, он характеризует период запаздывания yt относительно yt-τ.
В общем виде коэффициента корреляции рассчитывается по формуле
, где
yt и yt+τ – значения фактического и смещенного во времени рядов соответственно
τ – значение временного лага
В процессе расчетов коэффициента автокорреляции временной лаг не должен превышать величины Т/4 для больших временных выборок и Т/10 для малых. Это ограничение вызвано тем, что с увеличением временного лага уменьшается число пар наблюдений.
Коэффициент автокорреляции изменяется
в пределах от -1 до 1. Значение, приближенное
по модулю к единице говорит о
высокой коррелированности
Совокупность значений коэффициентов с разными лагами образует выборочную автокорреляционную функцию, а представленная на графике функция rτ называется коррелограммой
Валовой региональный продукт – ряд, содержащий долгосрочную тенденцию. следовательно, все значения коэффициентов положительны и первый коэффициент rτ достаточно большой, а все последующие имеют плавную тенденцию к снижению.
Основная особенность
Один из способов устранения автокорреляции заключается в удалении тренда из временного ряда. В этом случае коррелируют не сами уровни рядов, а их отклонения от трендов. Тренд может быть выделен путем аналитического выравнивания или одним из методов сглаживания. После удаления тренда необходимо убедиться в отсутствии автокорреляции в отклонениях. Формула коэффициента корреляции по отклонениям от трендов имеет вид
, где
хt, Yt - фактические значения показателей
, -детерминированная составляющая трендовой модели
- возмущения трендовой модели.
В качестве этих оценок выступают отклонения наблюдений от оцененной линии трендов. При этом следует убедиться в отсутствии автокорреляции в остатках.
Второй способ удаления автокорреляции из временных рядов - вычисление последовательных разностей. Пусть хt, Yt временные ряды, а - первые разности (от последующего наблюдения отнимаем предыдущее с соответствующим шагом t=2,3,…T). Для них коэффициент корреляции последовательных разностей определяют как:
Корреляция последовательных разностей более эффективна для рядов, включающих краткосрочные корреляции уровней. Для подобных временных рядов удаление трендов не всегда дает хорошие результаты, иногда при удалении тренда автокорреляция сохраняется в остатках. Вычисление последовательных разностей позволяет освободить временные ряды от автокорреляции.
Построение регрессионных
Вторая проблема сопряжена с
появлением автокорреляции в остаточной
компоненте регрессионной модели. Если
модель построена на пространственной
выборке, то независимость остатков
означает, что случайные возмущения
или помехи на одном объекте не
оказывают влияния на случайные
возмущения на другом объекте. Для временных
выборок это условие
Лаговая корреляция рассматривается
в ситуациях, связанных с запаздыванием,
когда влияние одного показателя
на другой проявляется с некоторым
интервалом времени. Этот временной
интервал также называют запаздыванием
или временным лагом. Для лаговых
зависимостей используется стандартная
техника корреляционного и
Для анализа на практике с помощью статистических методов рассмотрим показатели государственной статистики о социально-экономическом положении Российской Федерации в 2001-2010 годах. Данные были взяты с сайта Федеральной службы государственной статистики, при этом были выбраны ежегодные показатели за десять лет (таблица №1).
Таблица 1- Факторы, влияющие на величину ВРП | ||||||
Сибирский федеральный округ |
ВРП (млн. руб.) |
Номинальная заработная плата (руб.) |
Инвестиции в основной капитал (млн. руб.) |
Незанятые (тыс.чел.) |
Спрос на труд (чел.) |
Объем платных услуг (млн. руб.) |
Y |
X1 |
X2 |
X3 |
X4 |
X5 | |
2010 |
3491449,3 |
15381.4 |
895248 |
269,8 |
104322 |
418796 |
2009 |
3 027 504.4 |
12344.8 |
684659.7 |
296 |
156824 |
356180.1 |
2008 |
2 442 999.2 |
9877.5 |
483721.4 |
348.5 |
115824 |
290223 |
2007 |
1 951 299.4 |
8109.7 |
346105.1 |
346.8 |
96039 |
238750 |
2006 |
1 631 782.5 |
6507.8 |
255399.2 |
362.8 |
81766 |
187242 |
2005 |
1 209 596.7 |
5325.3 |
193613.8 |
320.8 |
79741 |
152600 |
2004 |
991 736.7 |
4309.5 |
150109,0 |
297.4 |
71709 |
118985 |
2003 |
844 142.2 |
3190.8 |
135116,0 |
249.4 |
79555 |
84621 |
2002 |
687 070.8 |
2269.6 |
98647,0 |
196.9 |
63890 |
64508 |
2001 |
467 359.8 |
1559.5 |
61875,0 |
216.6 |
44773 |
48543 |
Информация о работе Анализ факторов динамики валового регионального продукта