Парная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 23 Января 2013 в 16:43, лабораторная работа

Описание работы

Парная регрессия – уравнение связи двух переменных y и x: , где y – зависимая переменная (результативный признак); x – независимая, объясняющая переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия: y = a + bx + .
Нелинейные регрессии делятся на два класса: регрессии, нелинейные относи-тельно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам

Файлы: 1 файл

Парная регрессия и корреляция контр настя.doc

— 231.00 Кб (Скачать файл)

Федеральное государственное автономное образовательное учреждение 
высшего профессионального образования

«СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

Институт управления бизнес-процессами и экономики

Кафедра экономики и  информационных технологий менеджмента

ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ

Парная регрессия  и корреляция

Преподаватель  ___________  С.Н.Ежеманская

подпись, дата

Студент ПЭ 10-08  ___________  Д.А.Давыденко

подпись, дата

Красноярск 2012

 

 

 Теоретическое введение

Парная регрессия – уравнение связи двух переменных y и x: , где y – зависимая переменная (результативный признак); x – независимая, объясняющая переменная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия: y = a + bx + e.

Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

Регрессии, нелинейные по объясняющим переменным:

      • полиномы разных степеней y = a + b1x + b2x2 + b3x3 + e;
      • равносторонняя гипербола .

Регрессии, нелинейные по оцениваемым параметрам:

      • степенная ;
      • показательная ;
      • экспоненциальная .

Построение уравнения  регрессии сводится к оценке ее параметров. Для оценки параметров регрессии, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y от теоретических минимальна, т.е.

.

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b:

Можно воспользоваться  готовыми формулами, которые вытекают из этой системы:

 
.

Тесноту связи изучаемых  явлений оценивает линейный коэффициент парной корреляции для линейной регрессии :

и индекс корреляции – для нелинейной регрессии :

.

Оценку качества построенной  модели даст коэффициент (индекс) детерминации, а так же средняя ошибка аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчётных значений от фактических:

.

Доступный предел значений - не более 8-10%.

Долю дисперсии, объясняемую  регрессией, в общей дисперсии результативного признака y характеризует коэффициент (индекс) детерминации R2:

.

Коэффициент детерминации – квадрат коэффициента или индекса  корреляции.

Практическая часть

Постановка задачи

По тринадцати территориям России потребительские расходы в расчете на душу населения, а также средняя заработная плата и выплаты социального характера представлены на рисунке 1.

Рисунок 1- Исходные данные

    Для характеристики зависимости y от x требуется рассчитать параметры следующих функций:

  1. линейной;
  2. степенной;
  3. показательной;
  4. равносторонней гиперболы.

Так же необходимо оценить каждую модель через среднюю ошибку аппроксимации и коэффициент детерминации.

 Решение задачи

a) Для расчета параметров линейной регрессии y = a + bx решаем систему нормальных уравнений относительно a и b:

По исходным данным рассчитываем Sy, Sx, Syx, Sx2,Sy2. Результаты расчета представлены на рисунке 2.

 

 

,

.

Уравнение регрессии: . С увеличением средней заработной платы и выплат социального характера на 1 руб. доля расходов в расчете на душу населения увеличивается в среднем на 0,41 %.

 

 

Рассчитаем линейный коэффициент парной корреляции:

.

Связь умеренная, прямая.

Определим коэффициент  детерминации:

.

Вариация результата на 44,7% объясняется вариацией фактора x.

Подставляя в уравнение  регрессии фактические значения x, определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации :

.

В среднем расчетные  значения отклоняются от фактических  на 14%.

b) Построению степенной модели предшествует процедура линеаризации переменных. Линеаризация проводится путем логарифмирования обеих частей уравнения:

lg y = lg a +b lg x;

Y = C +b X,

где Y = lg y, X = lg x, C = lg a.

Для расчетов используем данные, представленные на рисунке 3.

 

Рассчитаем С и b:

;

.

Получим линейное уравнение: .

Выполнив его потенцирование, получим:

.

Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата . По ним рассчитаем показатели: тесноты связи – индекс корреляции и среднюю ошибку аппроксимации :

.

Характеристики степенной модели указывают, что она несколько хуже линейной функции описывает взаимосвязь.

c) Построению уравнения показательной кривой предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:

lg y = lg a +x lg b;

Y = C +B x,

где Y = lg y, B = lg b, C = lg a.

Для расчетов используем данные, представленные на рисунке 4.

 

Значения параметров регрессии A и B составили:

,

.

Получено линейное уравнение: .

Произведем потенцирование полученного уравнения и запишем  его в обычной форме: .

Тесноту связи оценим через индекс корреляции :

Связь сильная.

,что говорит об очень маленькой  ошибке аппроксимации. Показательная функция лучше, чем степенная, описывает изучаемую зависимость.

d) Уравнение равносторонней гиперболы линеаризуется при замене: . Тогда y = a + b z.

Для расчетов используем данные рисунка 5.

Значения параметров регрессии  a и b составили:

,

.

Получено уравнение: .

Тесноту связи оценим через индекс корреляции :

.

. По уравнению равносторонней гиперболы получена оценка тесноты связи меньше по сравнению с показательной регрессией. говорит о повышенной ошибке на недопустимом уровне.

 

Заключение

В данной работе мы для характеристики зависимости y от x рассчитать параметры линейной, степенной , показательной и гиперболической функций. Оценили каждую модель через среднюю ошибку аппроксимации и коэффициент детерминации.

Проанализировав полученные данные можно сделать  следующий вывод: из всех полученных моделей показательная функция лучше, чем линейная, степенная и гиперболическая описывает изучаемую зависимость.

Ошибка аппроксимации  минимальна и составляет всего 1%, что намного ниже, чем у других полученных функций.

Теснота связи равна 0,97. Это значит, что связь сильная.

 

 




Информация о работе Парная регрессия и корреляция