Линейная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 23 Августа 2012 в 10:39, контрольная работа

Описание работы

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной.

Содержание работы

I. Теоретическая часть

Введение
1. Спецификация, смысл и оценка параметров линейной регрессии и корреляция
2. Оценка существенности параметров линейной регрессии и корреляции
3. Интервалы прогноза по линейному уравнению регрессии
4. Нелинейная регрессия
Заключение
Список использованной литературы

II. Практическая часть

Файлы: 1 файл

Министерство здравоохранения Украины.docx

— 164.47 Кб (Скачать файл)

Различают два класса нелинейных регрессий:

- регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;

- регрессии, нелинейные по оцениваемым параметрам.

Примером  нелинейной регрессии по включаемым в нее объясняющим переменным могут служить следующие функции:

  • полиномы разных степеней;
  • равносторонняя гипербола.

К нелинейным регрессиям по оцениваемым параметрам относятся функции:

  • степенная;
  • показательная;
  • экспоненциальная.

Нелинейная  регрессия по включенным переменным не таит каких-либо сложностей в оценке ее параметров. Она определяется, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в параболе второй степени y=a0+a1x+a2x2+ε заменяя переменные x=x1,x2=x2, получим двухфакторное уравнение линейной регрессии: у=а01х12х2+ ε.

Парабола  второй степени целесообразна к  применению, если для определенного  интервала значений фактора меняется характер связи рассматриваемых  признаков: прямая связь меняется на обратную или обратная на прямую. В  этом случае определяется значение фактора, при котором достигается максимальное (или минимальное), значение результативного  признака: приравниваем к нулю первую производную параболы второй степени: , т.е. b+2cx=0 и x=-b/2c.

Применение  МНК для оценки параметров параболы второй степени приводит к следующей  системе нормальных уравнений:

 

 

 

Решение ее возможно методом определителей:

 

  .

 

В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразованным  уравнениям. Если в линейной модели и моделях, нелинейных по переменным, при оценке параметров исходят из критерия min, то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным данным результативного признака, а к их преобразованным величинам, т.е. ln y, 1/y. Так, в степенной функции МНК применяется к преобразованному уравнению lny = lnα + β ln x ln ε. Это значит, что оценка параметров основывается на минимизации суммы квадратов отклонений в логарифмах. Соответственно если в линейных моделях то в моделях, нелинейных по оцениваемым параметрам, . Вследствие этого оценка параметров оказываются несколько смещенной.

Уравнение нелинейной регрессии, так же как  и в линейной зависимости, дополняется  показателем корреляции, а именно индексом корреляции (R):

 

 

Величина  данного показателя находится в  границах: 0 ≤ R ≤ 1, чем ближе к 1, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Индекс  детерминации используется для проверки существенности в целом урпвнения  нелинейной регрессии по F- критерию Фишера:

 

,

 

где R2- индекс детерминации, n- число наблюдений, m - число параметров при переменной х.

Данный  способ расчета наиболее обоснован  теоретически и дает самые точные результаты в практическом применении. Но дело осложняется рядом обстоятельств. Во-первых, качество большинства видов  продукции, а, следовательно, и его  уровень формируются чаще не одним, а несколькими свойствами, причем значимость их в формировании полезности различна. Встает сложная проблема определения их значимости. Во-вторых, полезность продукта находится чаще в нелинейной зависимости от значения свойств (частных качественных характеристик), а это означает непостоянство их значимости. Указанные сложности преодолимы, но не всегда.

Теснота связи между переменными величинами может иметь различные значения, если рассматривать ее с позиции  характера зависимости (линейная, нелинейная). Если установлена слабая связь между  переменными в линейной зависимости, то это совсем не означает, что такая  связь должна быть в нелинейной зависимости. Показателем, характеризующим значимость факторов при различной форме  связи, является корреляционное отношение. Оценка факторов по корреляционному  отношению уже на этом этапе анализа  позволяет предварительно уст0новить вид многофакторной связи, что служит хорошей предпосылкой при выборе конкретной модели исследуемого показателя.

В случае нелинейной зависимости линейный коэффициент  корреляции теряет смысл, и для измерения  тесноты связи применяют так  называемое корреляционное отношение, известное также под названием  «индекс корреляции»:

Для нахождения лучшей подстановки можно использовать визуальный метод, когда «на глаз»  определяется вид нелинейной зависимости, связывающей результирующий параметр и независимый фактор, а можно  выбор наилучшей замены осуществлять, используя коэффициент корреляции. Та подстановка, у которой коэффициент  корреляции является максимальным, и  является наилучшей.6

Заключение

 

Корреляционно-регрессионный  анализ как общее понятие включает в себя измерение тесноты, направления  связи и установление аналитического выражения (формы) связи.

Наиболее  разработанной в теории статистики является методология парной корреляции, рассматривающая влияние вариации факторного признака х на результативный у и представляющая собой однофакторный  корреляционный и регрессионный  анализ.

Регрессионный анализ своей целью имеет вывод, определение (идентификацию) уравнения  регрессии, включая статистическую оценку его параметров. Уравнение  регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых  переменных известна. Ряд авторов  считают корреляционный анализ частью регрессионного анализа, а другие полагают, что регрессионный анализ является частью корреляционного, как общей теории взаимосвязи между случайными величинами.

Практически, речь идет о том, чтобы анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности, точно  отражающую заключенную в этом множестве  закономерность (тренд, тенденцию) - линию  регрессии.

 

Список использованной литературы

 

  1. Голованов Е.А. Основы корреляционного и регрессионного анализа. - М.: Наука, 1991.
  2. Доугерти К. Введение в эконометрику. - М.: Финансы и статистика, 1999.
  3. Елисеева И.И., Курышева С.В., Костеева Т.В. и др. Эконометрика. - М.: Финансы и статистика, 2001.
  4. Ланге О. Введение в эконометрику. - М.: Прогресс, 1964.
  5. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. - М.: Дело, 2001.
  6. Маленво Э. Статистические методы в эконометрии. - М.: Статистика, 1976.

1 Доугерти К. Введение в эконометрику. - М.: Финансы и статистика, 1999. - С. 10.

2 Елисеева И.И., Курышева С.В., Костеева Т.В. и др. Эконометрика. - М.: Финансы и статистика, 2001. - С. 33.

3 Голованов Е.А. Основы корреляционного и регрессионного анализа. - М.: Наука, 1991. - С. 25.

4 Маленво Э. Статистические методы в эконометрии. - М.: Статистика, 1976. - С. 37.

5 Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. - М.: Дело, 2001. - С. 45.

6 Ланге О. Введение в эконометрику. - М.: Прогресс, 1964. - С. 76.

 


Информация о работе Линейная регрессия и корреляция