Построение исходной модели № 1 и ее анализ

Автор работы: Пользователь скрыл имя, 29 Апреля 2013 в 22:50, курсовая работа

Описание работы

Цель данной курсовой работы построить оптимальную эконометрическую модель зависимости количества грабежей от некоторых основных факторов.

Содержание работы

Введение 3
1. Построение исходной модели № 1 и ее анализ 5
2. Построение улучшенной модели № 2 и ее анализ 10
3. Построение окончательной модели № 3 и ее анализ 14
Заключение 16
Список литературы 17
Приложения

Скачать архив (162.93 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

эконометрика - курсовая.doc

— 1,003.50 Кб (Скачать файл)

СОДЕРЖАНИЕ

Введение

Известно, что на совершение человеком каких-либо преступлений в обществе влияет совокупность факторов, причем между определенными показателями существует значимая связь. Например, изменение покупательная способность населения зависит от изменения объема денежных доходов населения. Тенденция изменения количества и состава преступлений среди некоторых категорий граждан, например, зависит от изменения их денежных доходов и от социального статуса (безработица). В связи с этим возникает вопрос, каким образом можно спрогнозировать результат изменения одного показателя с учетом тенденции изменения других показателей?

Одним из таких методов является использование инструментов эконометрики. Эконометрика как научная дисциплина расположена на стыке экономики, статистики и математики. Обычно в качестве ее основных задач выделяют обнаружение и анализ статистических закономерностей, построение на базе выявленных эмпирических зависимостей эконометрических моделей.

Методологическая особенность эконометрики заключается в применении общих гипотез о статистических свойствах экономических параметров и ошибок при их измерении. Полученные при этом результаты могут оказаться нетождественными тому содержанию, которое вкладывается в реальный объект. Поэтому важная задача эконометрики – создание как более универсальных, так и специальных методов для обнаружения наиболее устойчивых характеристик в поведении реальных экономических показателей. Эконометрика разрабатывает методы «подгонки» формальной модели с целью наилучшего имитирования ею поведения моделируемого объекта на основе гипотезы о том, что отклонение модельных параметров от реально наблюдаемых случайны и вероятностные характеристики их известны

Главным инструментом эконометрики служит эконометрическая модель – модель факторного анализа, параметры которой оцениваются средствами математической статистики. Такая модель выступает в качестве средства анализа и прогнозирования конкретных экономических процессов на основе реальной статистической информации.

Поскольку разновидностей преступлений в настоящее время существует великое множество, то для упрощения построения эконометрической модели выбраны только данные по количеству грабежей всех регионов Российской Федерации.

Статистические данные о количестве грабежей в том или ином регионе взяты с информационного сайта сети Интернет «Россия в цифрах», причем из рассмотрения была исключена Чеченская Республика, поскольку данных по указанному региону в базе данным не имеется.

1. Построение исходной модели № 1 и ее анализ

Построение исходной модели № 1 основано на данных по количеству грабежей в регионах Российской Федерации (таблица в приложении 1).

Количественное влияние отдельных факторов на грабежи можно определить с помощью корреляционно-регрессионного анализа. Уравнение множественной регрессии по обследованным регионам Российской Федерации имеет следующий вид:

Исходное уравнение множественной линейной регрессии (как оценка модели) в общем виде может быть записано как

y = a + b₁x₁ + b₂x₂ + b₃x₃ + b₄x₄ + b₅x₅ + b₆x₆,

где

у – количество грабежей в год;

х₁ – средний денежный доход населения (руб.);

х₂ – стоимость основных фондов (млн. руб.);

х₃ – валовой региональный продукт (млн. руб.);

х₄ – процент городского населения в регионе (%);

х₅ – количество женщин на 1000 мужчин (чел);

х₆ – уровень безработных по отношению к экономически активному населению (%);

а – оценка свободного члена уравнения регрессии;

b_k – оценки коэффициентов регрессии при переменных x_k.

Рассчитаем параметры модели.

В Excel существует встроенная функция, которая позволяет проводить анализ множественной регрессии, вычислять значения коэффициентов для уравнения множественной регрессии и определять некоторые другие характеристики регрессии взаимосвязанных показателей (например, значение дисперсии).

Для того чтобы воспользоваться встроенной функцией, необходимо внести данные наблюдений показателя, который необходимо прогнозировать, в ячейки рабочего листа Excel, например, в столбец B (B2:B89). Данные наблюдений связанных показателей за аналогичный период времени внесем в соседние ячейки, в столбцы B, C, D, Е, f, G, H (в зависимости от количества связанных показателей). Далее, в меню «Сервис» выберем «Анализ данных». В открывшемся диалоговом окне выберем инструмент «Регрессия». Нажмем «ОК». В диалоговом окне инструмента «Регрессия» введем входной интервал Y – интервал с данными наблюдений прогнозируемого показателя (В2:В89). Входной интервал Х – полностью весь интервал с данными наблюдений всех связанных показателей, например, С2:Н89. Нажмем «ОК». В новом листе (если выбрать параметры вывода – новый рабочий лист) появятся итоги регрессионного анализа взаимосвязанных показателей.

На основе данных полученного анализа можно построить уравнение множественной регрессии. В качестве коэффициентов уравнения будут значения, полученные в столбце «Коэффициенты» самой нижней таблицы анализа. А0 – «Y – пересечение», В1 – Вn – значения для соответствующих переменных «Х1 –Хn». Используя полученное уравнение, можно определить прогнозное значение исследуемого показателя на любой будущий период, подставляя вместо переменных Х1 – Хn планируемые значения предсказуемых связанных показателей.

Результаты оценки модели представлены в приложении 2.

Получили следующее уравнение модели № 1:

y = 4953,011 -0,839x₁ + 0,006x₂ + 0,004x₃ + 30,270x₄ - 4,497x₅ -25,061x₆,

Составим график для сравнения эмпирических (исходных) и расчетных (прогнозируемых) значений количества грабежей по регионам по уравнению модели № 1 (приложение 3).

Из графика видно, что модель наиболее хорошо прогнозирует регионы: Адыгея, Карачаево-Черкессия, Карелия, Коми-Пермяцкий автономный округ, Ивановская область, Мурманская область. Наименее хорошо спрогнозированными оказались следующие регионы: Иркутская область, г. Санкт-Петербург, г. Москва, Нижегородская область, Пермская область, Свердловская область, Челябинская область.

Для улучшения качества модели необходимо ввести фиктивную переменную D, значения которой равно 1 для плохо прогнозируемых регионов, и 0 – для остальных.

Дисперсионный анализ множественной регрессии проводится в таблицах вида (см. приложение 2):

Таблица 1

Таблица дисперсионного анализа регрессии

Источник вариации	Сумма квадратов	Степени свободы	Средние квадраты	F- отношение
Модель Ошибки	SSR SSE	m n – m - 1	MSR MSE	F=
Общая	SST	n - 1

Здесь MSR = SSR/m и MSE = SSE/(n-m-1) – оценки дисперсии , рассчитанные в разных условиях и сравниваемые затем на основе критерия Фишера.

Вернемся еще раз к MSE. Этот показатель является одной из характеристик точности уравнения регрессии. По – другому его называют остаточной дисперсией и обозначают S_ост.. Как отмечалось, MSE является несмещенной оценкой дисперсии .

MSE также используется при вычислении других показателей точности уравнения регрессии. Например, корень квадратный из MSE называется стандартной ошибкой оценки по регрессии (S_y,x) и показывает, какую ошибку в среднем мы будем допускать, если значение зависимой переменной будем оценивать по оцененному уравнению регрессии на основе известных значений независимых переменных. Имеем:

Кроме того, этот показатель в неявном виде участвует в определении еще одного показателя точности уравнения множественной регрессии, а именно коэффициента множественной детерминации (R²). Как известно,

или после преобразований

Отсюда следует, что коэффициент множественной детерминации показывает долю вариации результирующего показателя, обусловленную вариацией включенных в уравнение регрессии независимых переменных, или, иными словами, обусловленную регрессионной зависимостью.

Коэффициент множественной детерминации обычно выражают в процентах, поэтому, например, для модели № 1 R² = 62,8 %, то это означает, что изменение зависимой переменной на 62,8 % объясняется изменением включенных в уравнение регрессии независимых переменных, а остальные 37,2 % изменения зависимой переменной обусловлено изменением неучтенных факторов, в том числе и ошибками.

Корень квадратный из коэффициента множественной детерминации является коэффициентом множественной корреляции:

Коэффициент множественной корреляции показывает тесноту линейной корреляционной связи между зависимой переменной и всеми независимыми переменными. По сути дела, это коэффициент корреляции между фактическими и расчетными значениями зависимой переменной.

Коэффициент множественной детерминации R² изменяется от нуля до единицы, и равен единице, если SSE = 0, т. е. когда связь линейная функциональная, и равен нулю, если SST = SSE, т. е. когда связь отсутствует.

Значимость коэффициента множественной детерминации определяется на основе критерия Фишера:

с m степенями свободы числителя и (n–m–1) степенями свободы знаменателя.

Известно, что коэффициент множественной детерминации является завышенной оценкой точности уравнения регрессии, поэтому разработана преобразованная форма этого коэффициента, имеющая вид:

или, после преобразования:

Здесь – исправленное c учетом степеней свободы значение коэффициента множественной детерминации (adjusted for df).

Из определения коэффициента множественной детерминации следует, что он будет увеличиваться при добавлении в уравнение регрессии независимых переменных, как бы слабо не были они связаны с независимой переменной. Следуя этой логике, в уравнение регрессии для увеличения точности отражения изучаемой зависимости может быть включено неоправданно много независимых переменных. Точность уравнения при этом может увеличиться незначительно, а размерность модели возрасти так, что ее анализ будет затруднен. Для преодоления этого недостатка и был разработан исправленный (на число степеней свободы) коэффициент множественной детерминации. В отличие от , будет убывать, если в уравнение регрессии будут добавляться незначимые независимые переменные.

Исправленный коэффициент позволяет избежать переоценки независимой переменной при включении ее в уравнение регрессии. Если добавление переменной приводит к увеличению , то включение ее в уравнение регрессии оправдано, в противном случае – нет

Коэффициент множественной детерминации модели (см. приложение 2) указывает на то, что связь между изучаемыми факторами характеризуется как заметная.

2. Построение улучшенной модели № 2 и ее анализ

Итак, для расчета модели № 2 необходимо ввести фиктивную переменную D, значения которой равно 1 для плохо прогнозируемых регионов, и 0 – для остальных.

Уравнение множественной линейной регрессии (как оценка модели) в общем виде может быть записано как

y = a + b₁x₁ + b₂x₂ + b₃x₃ + b₄x₄ + b₅x₅ + b₆x₆ + b₇x₇.

где