Автор работы: Пользователь скрыл имя, 23 Января 2013 в 16:43, лабораторная работа
Парная регрессия – уравнение связи двух переменных y и x: , где y – зависимая переменная (результативный признак); x – независимая, объясняющая переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия: y = a + bx + .
Нелинейные регрессии делятся на два класса: регрессии, нелинейные относи-тельно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам
Федеральное государственное автономное
образовательное учреждение
высшего профессионального образования
«СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ
Институт управления бизнес-процессами и экономики
Кафедра экономики и информационных технологий менеджмента
ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ
Парная регрессия и корреляция
Преподаватель ___________ С.
подпись, дата
Студент ПЭ 10-08 ___________ Д.А.
подпись, дата
Красноярск 2012
Теоретическое введение
Парная регрессия – уравнение связи двух переменных y и x: , где y – зависимая переменная (результативный признак); x – независимая, объясняющая переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия: y = a + bx + e.
Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
Регрессии, нелинейные по оцениваемым параметрам:
Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессии, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y от теоретических минимальна, т.е.
Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b:
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии :
и индекс корреляции – для нелинейной регрессии :
Оценку качества построенной модели даст коэффициент (индекс) детерминации, а так же средняя ошибка аппроксимации.
Средняя ошибка аппроксимации – среднее отклонение расчётных значений от фактических:
Доступный предел значений - не более 8-10%.
Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака y характеризует коэффициент (индекс) детерминации R2:
Коэффициент детерминации – квадрат коэффициента или индекса корреляции.
Практическая часть
Постановка задачи
По тринадцати территориям России потребительские расходы в расчете на душу населения, а также средняя заработная плата и выплаты социального характера представлены на рисунке 1.
Рисунок 1- Исходные данные
Для характеристики зависимости y от x требуется рассчитать параметры следующих функций:
Так же необходимо оценить каждую модель через среднюю ошибку аппроксимации и коэффициент детерминации.
Решение задачи
a) Для расчета параметров линейной регрессии y = a + bx решаем систему нормальных уравнений относительно a и b:
По исходным данным рассчитываем Sy, Sx, Syx, Sx2,Sy2. Результаты расчета представлены на рисунке 2.
Уравнение регрессии: . С увеличением средней заработной платы и выплат социального характера на 1 руб. доля расходов в расчете на душу населения увеличивается в среднем на 0,41 %.
Рассчитаем линейный коэффициент парной корреляции:
Связь умеренная, прямая.
Определим коэффициент детерминации:
Вариация результата на 44,7% объясняется вариацией фактора x.
Подставляя в уравнение регрессии фактические значения x, определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на 14%.
b) Построению степенной модели предшествует процедура линеаризации переменных. Линеаризация проводится путем логарифмирования обеих частей уравнения:
lg y = lg a +b lg x;
Y = C +b X,
где Y = lg y, X = lg x, C = lg a.
Для расчетов используем данные, представленные на рисунке 3.
Рассчитаем С и b:
Получим линейное уравнение: .
Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата . По ним рассчитаем показатели: тесноты связи – индекс корреляции и среднюю ошибку аппроксимации :
Характеристики степенной модели указывают, что она несколько хуже линейной функции описывает взаимосвязь.
c) Построению уравнения показательной кривой предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:
lg y = lg a +x lg b;
Y = C +B x,
где Y = lg y, B = lg b, C = lg a.
Для расчетов используем данные, представленные на рисунке 4.
Значения параметров регрессии A и B составили:
Получено линейное уравнение: .
Произведем потенцирование
полученного уравнения и
Тесноту связи оценим через индекс корреляции :
Связь сильная.
,что говорит об очень
d) Уравнение равносторонней гиперболы линеаризуется при замене: . Тогда y = a + b z.
Для расчетов используем данные рисунка 5.
Значения параметров регрессии a и b составили:
Получено уравнение: .
Тесноту связи оценим через индекс корреляции :
. По уравнению равносторонней гиперболы получена оценка тесноты связи меньше по сравнению с показательной регрессией. говорит о повышенной ошибке на недопустимом уровне.
Заключение
Теснота связи равна 0,97. Это значит, что связь сильная.