Автор работы: Пользователь скрыл имя, 01 Апреля 2013 в 13:23, автореферат
В последовательности и содержании моделирования в социально-экономических системах можно выделить пять этапов: постановка проблемы и ее качественный анализ; построение модели; подготовка исходной информации; численное решение; анализ результатов и их применение.
Относительная ошибка аппроксимации - более адекватно характеризует точность каждого теоретического значения. Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации как среднюю арифметическую простую:
Желательно, чтобы средняя ошибка аппроксимации не превышала 12% ( ).
Остаточная сумма квадратов должна совпадать с минимально возможной, рассчитанной по методу наименьших квадратов.
Отношение суммы квадратов отклонений индивидуальных значений признака от средней арифметической к числу членов ряда называется дисперсией ( ). Для перехода к первой степени извлекается квадратный корень, получается величина, называемая средним квадратическим отклонением ( ). Остаточная дисперсия рассчитывается по формуле
Непосредственному расчету показателей адекватности предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения на две части «объясненную» и «необъясненную».
Общая сумма квадратов отклонений = Сумма квадратов отклонений, объясненная регрессией + Остаточная сумма квадратов отклонений
Аналогичная сумма справедлива для разложения дисперсии результативного признака.
Уравнение связи показывает общий закон, по которому результирующий показатель изменяется в зависимости от определяющего фактора.
Рассмотрим вопрос о надежности оценок зависимой переменной “у” в соответствии с величиной независимого показателя - фактора “х”. Если мы имеем ряд значений признака и основываем оценки только на этих данных, не принимая в расчет влияния каких либо факторов, то лучшей характеристикой ряда является обычно средняя арифметическая. Для оценки надежности средней для суждений об отдельных членах ряда используют некоторые показатели, наиболее часто из них применяется дисперсия.
Аналогичные операции с отклонениями фактических значений от вычисленных по регрессионному уравнению приводят к остаточной дисперсии.
Величина характеризует надежность оценок, полученных по регрессионному уравнению, а величина показывает надежность оценок с помощью средней.
Чтобы определить, насколько сократилась сумма квадратов отклонений при переходе от средней арифметической к уравнению регрессии, воспользуемся значениями дисперсий и разделим разницу двух дисперсий на исходную дисперсию.
Величина R2 или коэффициент детерминации характеризует силу воздействия данной причины на связанный с ней показатель. Например, R2=0,99; это означает, что на 99% фактор “х” определяет колеблемость “у”, сумма квадратов отклонений при переходе от средней к уравнению регрессии значительно уменьшилась (на 99%).
Коэффициент детерминации чаще рассчитывается по другой формуле, полученной из первоначальной.
Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака.
Для перехода к первой степени извлекается квадратный корень из приведенного выражения. В результате получаем коэффициент или индекс корреляции (r). Другими словами, устанавливается степень соответствия типа функции реальным условиям или рассчитывается множественный коэффициент корреляции.
r =
где - средний квадрат отклонений фактических значений от вычисленных по регрессионному уравнению (остаточная дисперсия);
- средний квадрат отклонений фактических значений от их средней арифметической дисперсия результативного признака).
Уравнение зависимости и коэффициент корреляции являются двумя важнейшими характеристиками корреляционной зависимости между изучаемыми признаками. Уравнение в конкретной количественной форме показывает, какая существует зависимость между переменными, а коэффициент корреляции позволяет судить о силе этой зависимости о тесноте изучаемой связи.
В некоторых случаях корреляция оценивается по другому. Например, для частного случая парной линейной регрессии тесноту связи изучаемых явлений можно определить на основе линейного коэффициента парной корреляции:
(впервые предложен в 90-е годы Пирсоном, Эджвортом, Велдоном). Разработаны различные модификации формул расчета данного коэффициента.
Коэффициенты корреляции по абсолютной величине могут принимать значения в пределах от нуля до единицы.
Корреляция может быть положительной или отрицательной (коэффициент корреляции имеет тот же знак, который имеет параметр уравнения связи); знак характеризует направленность связи (прямая или обратная связь).
В таблице 2.1. примерные критерии оценки тесноты связи по коэффициенту корреляции.
Таблица 2.1.
Количественные критерии оценки тесноты связи
Величина коэффициента корреляции |
Характер связи |
До | ±0,3| |
Практически отсутствует |
от | ±0,3| до | ±0,5| |
Слабая |
от | ±0,5| до | ±0,7| |
Умеренная |
от | ±0,7| до | ±1,0| |
Сильная |
Величина коэффициента корреляции и, соответственно, коэффициента детерминации, равная 1 свидетельствует о функциональной зависимости, что требует корректировки в разработке модели.
Между линейным коэффициентом корреляции и коэффициентом линейной регрессии существует определенная зависимость, выражаемая формулой:
где аi - коэффициент регрессии в уравнении связи;
- среднее квадратическое
96. Адекватность модели связи (критерий Фишера)
Значимость регрессионного уравнения в целом оценивается с помощью F – критерия Фишера. F – отношение или F – критерий Фишера получают путем сопоставления факторной (объясненной) и остаточной дисперсии в расчете на одну степень свободы. Величина F – критерия Фишера связана с коэффициентом детерминации, поэтому значение критерия можно выразить и другой формулой.
Dфакт – факторная (объясненная) сумма квадратов на одну степень свободы;
Dост – остаточная сумма квадратов на одну степень свободы;
R2 – коэффициент детерминации;
m – число параметров при переменных ч (в линейной регрессии совпадает с числом включенных в модель факторов);
n – число наблюдений.
F – критерий используется для проверки нулевой гипотезы Н0: Dфакт = Dост
Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Разработаны таблицы критических значений F-отношений при различных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F – критерия – это максимальная величина отношений дисперсий, которая может иметь место при случайном расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт > Fтабл Н0 отклоняется.
Если же величина окажется меньше табличной Fфакт < Fтабл , то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Н0 не отклоняется.
При анализе достоверности
S2 – остаточная дисперсия на одну степень свободы.
На основе показателей адекватности и достоверности уравнения регрессии делается вывод о возможности использования данной функции в анализе, прогнозировании и принятии решения.
При адекватности уравнения регрессии исследуемому процессу возможны следующие варианты.
Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей проверяется с помощью F – критерия Фишера.
Расчетное значение вычисляется по формуле (в числителе всегда большая сумма квадратов):
Гипотеза о равенстве дисперсий двух наборов по m наблюдений (т.е. гипотеза об отсутствии гетероскедастичности остатков) отвергается, если расчетное значение превышает табличное F>Fα;m-p;m-p, где p – число регрессоров.
Мощность теста (вероятность отвергнуть гипотезу об отсутствии гетероскедастичности, когда гетероскедастичности действительно нет) максимальна, если выбирать m порядка n/3.
93. Гипотеза о существовании тренда. Метод Фостера-Стюарта и метод разности средних
Методы выявления тенденции временного ряда
В рядах динамики можно наблюдать тенденции трех видов: среднего уровня, дисперсии, автокорреляции. Последняя, как правило, характерна для связных рядов динамики.
В статистике разработан
ряд методов выявления
Рассмотрим применение некоторых методов на следующем примере.
Численность официально зарегистрированных в службе занятости безработных с течением времени изменяется. Изменения численности по кварталам за четыре года представлены в следующей таблице.
Таблица 3.1
Аналитические показатели динамики численности официально
зарегистрированных в службе занятости безработных
Время (год, квартал) |
Численность безработных, тыс. чел | |
I |
1 |
93,6 |
2 |
177,0 | |
3 |
303,0 | |
4 |
512,0 | |
II |
1 |
683,0 |
2 |
736,0 | |
3 |
712,0 | |
4 |
781,0 | |
III |
1 |
988,0 |
2 |
1220,0 | |
3 |
1381,0 | |
4 |
1554,0 | |
IV |
1 |
1823,0 |
2 |
1994,0 | |
3 |
2083,0 | |
4 |
2232,0 |
Метод сравнения средних уровней ряда
По данным таблицы определим наличие основной тенденции методом сравнения средних уровней ряда. Временной ряд делится на две равные части n1 и n2, по каждой вычисляются средние и дисперсии.
Проверим статистическую гипотезу о равенстве дисперсий при уровне значимости на основе критерия Фишера:
H0: σ12 = σ22; Н1: σ12 ≠ σ22
Fкp=(
В связи с тем, что Fp < Fкр, нулевая гипотеза о равенстве дисперсий совокупностей H0: σ12 = σ22 не отвергается. Дисперсии различаются незначимо, расхождение между ними носит случайный характер.
Информация о работе Этапы экономико-математического моделирования