Автор работы: Пользователь скрыл имя, 28 Сентября 2013 в 21:16, контрольная работа
Целью данной контрольной работы является анализ статистических данных социально-экономических показателей Томской области, а также вывод прогнозных значений по рассматриваемому региону на будущие периоды.
Данная работа будет проводиться с применением различных способов и методов разработки социально-экономических прогнозов.
Для достижения главной цели работы необходимо решить следующие задачи:
провести общий анализ социально-экономического положения региона, описать стратегию его развития;
рассчитать показатели динамики социально-экономических процессов;
выявить аномальные наблюдения и исключить их;
Введение……………………………..
Задача №1…………………………….
Задача №2…………………………
Задача №3……………………….
Задача №4……………………….
Задача №5……………………….
Заключение…………………………….
Библиографический список……………
Восточно-Сибирский
Институт экономики и права
Экономический факультет
КОНТРОЛЬНАЯ РАБОТА
по дисциплине
«Основы прогнозирования
социально-экономических
на тему:
«Оценка адекватности и точности моделей»
на примере
Томской области
Улан-Удэ
2013 г.
СОДЕРЖАНИЕ
Введение
В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особо важное значение имеют прогнозы социально-экономического развития общества, обоснование основных направлений экономической политики, предвидение последствий принимаемых решений.
Социально-экономическое
прогнозирование является одним
из решающих научных факторов формирования
стратегии и тактики
Целью данной контрольной работы является анализ статистических данных социально-экономических показателей Томской области, а также вывод прогнозных значений по рассматриваемому региону на будущие периоды.
Данная работа будет проводиться
с применением различных
Для достижения главной цели работы необходимо решить следующие задачи:
В процессе исследования использовались данные Федеральной службы Государственной статистики по России и Томской области.
Задание №1.
Конспект на тему: «Оценка адекватности и точности модели»
Независимо от вида и способа построения экономико-математической модели вопрос о возможности её применения в целях анализа и прогнозирования экономического явления может быть решен только после установления адекватности, то есть соответствия модели исследуемому процессу или объекту. Так как полного соответствия модели реальному процессу или объекту быть не может, адекватность — в какой-то мере условное понятие. При моделировании имеется в виду адекватность не вообще, а по тем свойствам модели, которые считаются существенными для исследования.
Анализ качества эмпирического уравнения парной и множественной линейной регрессии начинают с построения эмпирического уравнения регрессии, то есть модели, которая является начальным этапом эконометрического анализа. После того, как модель построена, необходимо удостовериться в её качестве, поскольку уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. С этой целью выполняют проверку точности этой модели и её адекватности процессу, объекту или явлению, для которых она построена.
Проверить адекватность модели
– значит установить, насколько
хорошо модель описывает реальные процессы,
происходящие в системе, насколько
качественно она будет
Проверка адекватности проводится
на основании некоторой
В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:
Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ, как правило, проводится для ограниченной по объёму совокупности.
Параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Для практического использования моделей регрессии большое значение имеет их адекватность, тo есть соответствие фактическим статистическим данным.
При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:
1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.
2. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.
3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На её основе не принимаются решения и не осуществляются прогнозы.
Проверить значимость (качество) уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).
Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели.
Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной (y) от среднего значения (yср.) раскладывается на две части: «объясненную» и «необъясненную»:
Схема дисперсионного анализа имеет следующий вид:
где n –число наблюдений, m–число параметров при переменной x
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия Фишера. Фактическое значение F -критерия Фишера сравнивается с табличным значением Fтабл. (α, k1, k2) при заданном уровне значимости α и степенях свободы k1= m и k2=n-m-1. При этом, если фактическое значение F-критерия больше табличного Fфакт> Fтабл, то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1 , поэтому:
Эта формула в общем виде может выглядеть так:
Отношение объясненной части дисперсии переменной (у) к общей дисперсии называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соотношение между объясненной и необъясненной частями общей дисперсии можно представить в альтернативном варианте:
Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0≤ R2 ≤1. Коэффициент детерминации R2 показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные.
При отсутствии зависимости между (у) и (x) коэффициент детерминации R2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества (точности) уравнения регрессии. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1 показывает, что модель объясняет почти всю изменчивость соответствующих переменных).
Чтобы определить, при каких значениях R2 уравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера: Fфакт > Fтеор - делаем вывод о статистической значимости уравнения регрессии. Величина F-критерия связана с коэффициентом детерминации и её можно рассчитать по следующей формуле:
Либо при оценке значимости индекса детерминации (аналог коэффициента детерминации):
где i2 - индекс (коэффициент) детерминации, который рассчитывается:
Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2. Поэтому, при большом количестве факторов, предпочтительнее использовать, так называемый, улучшенный, скорректированный коэффициент множественной детерминации R2, определяемый соотношением:
где p – число факторов в уравнении регрессии, n – число наблюдений.
Чем больше величина p, тем сильнее различия между множественным коэффициентом детерминации R2 и скорректированным R2.
При использовании
Низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации R2 может быть обусловлено следующими причинами:
Следует также обратить внимание на важность анализа остатков (остаточной, «необъясненной» дисперсии). Остаток представляет собой отклонение фактического значения зависимой переменной от значения, полученного расчетным путем. При построении уравнения регрессии, мы можем разбить значение (у) в каждом наблюдении на 2 составляющие:
Отсюда:
Если εi=0, то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции у=а0+а1x) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи.