Автор работы: Пользователь скрыл имя, 29 Апреля 2013 в 22:50, курсовая работа
Цель данной курсовой работы построить оптимальную эконометрическую модель зависимости количества грабежей от некоторых основных факторов.
Введение 3
1. Построение исходной модели № 1 и ее анализ 5
2. Построение улучшенной модели № 2 и ее анализ 10
3. Построение окончательной модели № 3 и ее анализ 14
Заключение 16
Список литературы 17
Приложения
СОДЕРЖАНИЕ
Известно, что на совершение человеком каких-либо преступлений в обществе влияет совокупность факторов, причем между определенными показателями существует значимая связь. Например, изменение покупательная способность населения зависит от изменения объема денежных доходов населения. Тенденция изменения количества и состава преступлений среди некоторых категорий граждан, например, зависит от изменения их денежных доходов и от социального статуса (безработица). В связи с этим возникает вопрос, каким образом можно спрогнозировать результат изменения одного показателя с учетом тенденции изменения других показателей?
Одним из таких методов является использование инструментов эконометрики. Эконометрика как научная дисциплина расположена на стыке экономики, статистики и математики. Обычно в качестве ее основных задач выделяют обнаружение и анализ статистических закономерностей, построение на базе выявленных эмпирических зависимостей эконометрических моделей.
Методологическая особенность эконометрики заключается в применении общих гипотез о статистических свойствах экономических параметров и ошибок при их измерении. Полученные при этом результаты могут оказаться нетождественными тому содержанию, которое вкладывается в реальный объект. Поэтому важная задача эконометрики – создание как более универсальных, так и специальных методов для обнаружения наиболее устойчивых характеристик в поведении реальных экономических показателей. Эконометрика разрабатывает методы «подгонки» формальной модели с целью наилучшего имитирования ею поведения моделируемого объекта на основе гипотезы о том, что отклонение модельных параметров от реально наблюдаемых случайны и вероятностные характеристики их известны
Главным инструментом эконометрики служит эконометрическая модель – модель факторного анализа, параметры которой оцениваются средствами математической статистики. Такая модель выступает в качестве средства анализа и прогнозирования конкретных экономических процессов на основе реальной статистической информации.
Поскольку разновидностей преступлений в настоящее время существует великое множество, то для упрощения построения эконометрической модели выбраны только данные по количеству грабежей всех регионов Российской Федерации.
Цель данной курсовой работы построить оптимальную эконометрическую модель зависимости количества грабежей от некоторых основных факторов.
Статистические данные о количестве грабежей в том или ином регионе взяты с информационного сайта сети Интернет «Россия в цифрах», причем из рассмотрения была исключена Чеченская Республика, поскольку данных по указанному региону в базе данным не имеется.
Построение исходной модели № 1 основано на данных по количеству грабежей в регионах Российской Федерации (таблица в приложении 1).
Количественное влияние
Исходное уравнение множественной линейной регрессии (как оценка модели) в общем виде может быть записано как
y = a + b1x1 + b2x2 + b3x3 + b4x4 + b5x5 + b6x6,
где
у – количество грабежей в год;
х1 – средний денежный доход населения (руб.);
х2 – стоимость основных фондов (млн. руб.);
х3 – валовой региональный продукт (млн. руб.);
х4 – процент городского населения в регионе (%);
х5 – количество женщин на 1000 мужчин (чел);
х6 – уровень безработных по отношению к экономически активному населению (%);
а – оценка свободного члена уравнения регрессии;
bk – оценки коэффициентов регрессии при переменных xk.
Рассчитаем параметры модели.
В Excel существует встроенная функция, которая позволяет проводить анализ множественной регрессии, вычислять значения коэффициентов для уравнения множественной регрессии и определять некоторые другие характеристики регрессии взаимосвязанных показателей (например, значение дисперсии).
Для того
чтобы воспользоваться
На основе данных полученного анализа можно построить уравнение множественной регрессии. В качестве коэффициентов уравнения будут значения, полученные в столбце «Коэффициенты» самой нижней таблицы анализа. А0 – «Y – пересечение», В1 – Вn – значения для соответствующих переменных «Х1 –Хn». Используя полученное уравнение, можно определить прогнозное значение исследуемого показателя на любой будущий период, подставляя вместо переменных Х1 – Хn планируемые значения предсказуемых связанных показателей.
Результаты оценки модели представлены в приложении 2.
Получили следующее уравнение модели № 1:
y = 4953,011 -0,839x1 + 0,006x2 + 0,004x3 + 30,270x4 - 4,497x5 -25,061x6,
Составим график для сравнения эмпирических (исходных) и расчетных (прогнозируемых) значений количества грабежей по регионам по уравнению модели № 1 (приложение 3).
Из графика видно, что модель наиболее хорошо прогнозирует регионы: Адыгея, Карачаево-Черкессия, Карелия, Коми-Пермяцкий автономный округ, Ивановская область, Мурманская область. Наименее хорошо спрогнозированными оказались следующие регионы: Иркутская область, г. Санкт-Петербург, г. Москва, Нижегородская область, Пермская область, Свердловская область, Челябинская область.
Для улучшения качества модели необходимо ввести фиктивную переменную D, значения которой равно 1 для плохо прогнозируемых регионов, и 0 – для остальных.
Дисперсионный анализ множественной регрессии проводится в таблицах вида (см. приложение 2):
Таблица 1
Источник вариации |
Сумма квадратов |
Степени свободы |
Средние квадраты |
F- отношение |
Модель Ошибки |
SSR SSE |
m n – m - 1 |
MSR MSE |
F= |
Общая |
SST |
n - 1 |
||
Здесь MSR = SSR/m и MSE = SSE/(n-m-1) – оценки дисперсии , рассчитанные в разных условиях и сравниваемые затем на основе критерия Фишера.
Вернемся еще раз к MSE. Этот показатель является одной из характеристик точности уравнения регрессии. По – другому его называют остаточной дисперсией и обозначают S ост.. Как отмечалось, MSE является несмещенной оценкой дисперсии .
MSE также используется при вычислении других показателей точности уравнения регрессии. Например, корень квадратный из MSE называется стандартной ошибкой оценки по регрессии (Sy,x) и показывает, какую ошибку в среднем мы будем допускать, если значение зависимой переменной будем оценивать по оцененному уравнению регрессии на основе известных значений независимых переменных. Имеем:
Кроме того, этот показатель в неявном виде участвует в определении еще одного показателя точности уравнения множественной регрессии, а именно коэффициента множественной детерминации (R2). Как известно,
или после преобразований
Отсюда следует, что коэффициент множественной детерминации показывает долю вариации результирующего показателя, обусловленную вариацией включенных в уравнение регрессии независимых переменных, или, иными словами, обусловленную регрессионной зависимостью.
Коэффициент множественной детерминации обычно выражают в процентах, поэтому, например, для модели № 1 R2 = 62,8 %, то это означает, что изменение зависимой переменной на 62,8 % объясняется изменением включенных в уравнение регрессии независимых переменных, а остальные 37,2 % изменения зависимой переменной обусловлено изменением неучтенных факторов, в том числе и ошибками.
Корень квадратный из коэффициента множественной детерминации является коэффициентом множественной корреляции:
Коэффициент множественной корреляции показывает тесноту линейной корреляционной связи между зависимой переменной и всеми независимыми переменными. По сути дела, это коэффициент корреляции между фактическими и расчетными значениями зависимой переменной.
Коэффициент множественной детерминации R2 изменяется от нуля до единицы, и равен единице, если SSE = 0, т. е. когда связь линейная функциональная, и равен нулю, если SST = SSE, т. е. когда связь отсутствует.
Значимость коэффициента множественной детерминации определяется на основе критерия Фишера:
с m степенями свободы числителя и (n–m–1) степенями свободы знаменателя.
Известно, что
коэффициент множественной
или, после преобразования:
.
Здесь – исправленное c учетом степеней свободы значение коэффициента множественной детерминации (adjusted for df).
Из определения коэффициента множественной детерминации следует, что он будет увеличиваться при добавлении в уравнение регрессии независимых переменных, как бы слабо не были они связаны с независимой переменной. Следуя этой логике, в уравнение регрессии для увеличения точности отражения изучаемой зависимости может быть включено неоправданно много независимых переменных. Точность уравнения при этом может увеличиться незначительно, а размерность модели возрасти так, что ее анализ будет затруднен. Для преодоления этого недостатка и был разработан исправленный (на число степеней свободы) коэффициент множественной детерминации. В отличие от , будет убывать, если в уравнение регрессии будут добавляться незначимые независимые переменные.
Исправленный коэффициент
Коэффициент множественной детерминации модели (см. приложение 2) указывает на то, что связь между изучаемыми факторами характеризуется как заметная.
Итак, для расчета модели № 2 необходимо ввести фиктивную переменную D, значения которой равно 1 для плохо прогнозируемых регионов, и 0 – для остальных.
Уравнение множественной линейной регрессии (как оценка модели) в общем виде может быть записано как
y = a + b1x1 + b2x2 + b3x3 + b4x4 + b5x5 + b6x6 + b7x7.
где
у – количество грабежей в год;
х1 – средний денежный доход населения (руб.);
х2 – стоимость основных фондов (млн. руб.);
х3 – валовой региональный продукт (млн. руб.);
х4 – процент городского населения в регионе (%);
х5 – количество женщин на 1000 мужчин (чел);
х6 – уровень безработных по отношению к экономически активному населению (%);
х7 – фиктивный параметр D;
а – оценка свободного члена уравнения регрессии;
bk – оценки коэффициентов регрессии при переменных xk.
Информация о работе Построение исходной модели № 1 и ее анализ