Оценка качества уравнения регрессии

Автор работы: Пользователь скрыл имя, 05 Сентября 2014 в 12:44, лекция

Описание работы

Теорема Гаусса-Маркова.
Анализ точности определения оценок коэффициентов регрессии.
Качество уравнения регрессии. Коэффициент детерминации.
Интервалы прогноза по линейному уравнению регрессии.

Файлы: 1 файл

n2.doc

— 402.00 Кб (Скачать файл)

- стандартная ошибка положения  линии регрессии. Так как она  минимальна при хр =  , то наилучший прогноз находится в центре области наблюдений и ухудшается по мере удаления от центра.

     Случайная величина  имеет распределение Стьюдента с (n-2) степенями свободы. Поэтому, задавая = Р( <tкр( , n-2)), можно построить доверительный интервал для М(У│Х = хр), то есть положения линии регрессии (рис. 1.):   ( )

Рис. 1. Доверительные интервалы положения линии регрессии – сплошная линия и индивидуального значения – пунктирная линия.

     Фактические значения у варьируются около среднего значения р. Индивидуальные значения у могут отклоняться от р на величину случайной ошибки . Пусть yi  - некоторое возможное значение у при хр. Если рассматривать yi как случайную величину У, а р – как случайную величину Ур, то можно отметить, что:

         Y ~ N( ,        Yp ~ N( ).

Y и Yp независимы и, следовательно, U = Y - Yp  ~ N  с параметрами

                    M(U) = 0;                  D(U) = .

Значит        случайная величина, имеющая распределение Стьюдента с (n-2) степенями свободы. Аналогично строится доверительный интервал индивидуального значения.

Пример.  Стандартная ошибка среднего расчетного значения

.

При ,  . При , . Следовательно,    и, т.к. ,   то               и

.

Стандартная ошибка индивидуального расчетного значения

,

    и     .

 

Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям. Поскольку может быть как положительной, так и отрицательной величиной, ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю.

Для того чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, находят среднюю ошибку аппроксимации как среднюю арифметическую простую.

.

 Допустимый предел 8 – 10 %, при котором подбор модели к исходным данным считается хорошим.

Возможно и другое определение средней ошибки аппроксимации:

.

Рассчитаем среднюю ошибку аппроксимации для нашего примера.

 

 

y

1

30

31,053

1,053

0,035

2

70

67,895

2,105

0,030

3

150

141,579

8,421

0,056

4

100

104,737

4,737

0,047

5

170

178,421

8,421

0,049

6

100

104,737

4,737

0,047

7

150

141,579

8,421

0,056

0,322


 

Окончательно получим: , что говорит о хорошем качестве уравнения.

Выборочный коэффициент вариации определяется отношением выборочного среднего квадратического отклонения к выборочной средней, выраженным в процентах:

      и     
.

Коэффициент вариации – безразмерная величина, удобная для сравнения величин рассеивания двух и более выборок, имеющих разные размерности. Совокупность данных считается однородной и пригодной для использования МНК и вероятностных методов оценок статистических гипотез, если значение коэффициента вариации не превосходит 35 %.

Для нашего примера:

,

.

Пример. Фирма провела рекламную компанию. Через 10 недель фирма решила проанализировать эффективность этого вида рекламы, сопоставив недельные объемы продаж (у, тыс. руб.) с расходами на рекламу (х, тыс. руб.).

Полагая, что между переменными х и у имеет место линейная зависимость, определить выборочное уравнение регрессии.

х

5

8

6

5

3

9

12

4

3

10

у

72

76

78

70

68

80

82

65

62

90


Решение см. в Excel.

 

 

 


Информация о работе Оценка качества уравнения регрессии