Автор работы: Пользователь скрыл имя, 03 Мая 2013 в 09:07, реферат
Задание:
1. Расчет параметров линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.
2. Сравнительная оценка силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
3. Оценка с помощью F-критерия Фишера - Снедекора значимости уравнения линейной регрессии и показателя тесноты связи.
4. Оценка статистической значимости коэффициентов регрессии с помощью t- критерия Стьюдента.
5. Оценка качества уравнения через среднюю ошибку аппроксимации.
Таблица 8 – Упорядоченные значения по фактору х3:
№ п/п |
y |
x3 |
1 |
45,4 |
1,2 |
2 |
45,6 |
6,7 |
3 |
45,7 |
7 |
4 |
46,3 |
7,8 |
5 |
45,8 |
9,7 |
6 |
46,9 |
12,4 |
7 |
45,9 |
12,5 |
8 |
46,7 |
14,6 |
9 |
46,9 |
17,2 |
10 |
46,9 |
17,9 |
11 |
46,7 |
18,8 |
12 |
47 |
19 |
13 |
46,3 |
20,5 |
14 |
45,7 |
23,4 |
15 |
46,6 |
24,8 |
16 |
45,9 |
27,8 |
17 |
46,3 |
28 |
18 |
45,4 |
30,5 |
19 |
47,6 |
30,7 |
20 |
44,1 |
38 |
21 |
46,1 |
40,6 |
22 |
46,8 |
41,2 |
23 |
46,4 |
61,5 |
24 |
49,1 |
100,6 |
25 |
51,9 |
216,1 |
2) Исключим С центральных наблюдений, разобьем совокупность на две части: а) со значениями x ниже центральных; б) со значениями x выше центральных.
Исключение С средних наблюдений в этом упорядочении в целях построения двух независимых "частных" регрессий по данным n' = (n-с)/2 в начале выборки и по данным n' = (n - с)/2 в конце выборки
Пусть С = 5, это наблюдения с порядковыми номерами 11-15.
3) Оцениваются отдельные регрессии для первой подвыборки (10 первых наблюдений) и для третьей подвыборки (10 последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (сумма квадратов отклонений ) будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов отклонений ).
4) По каждой части находим уравнение регрессии
Вывод итогов для подвыборок для фактора х2
Вывод итогов для подвыборок для фактора х3
5) Для сравнения соответствующих дисперсий строится следующая F-статистика:
- для х2:
- для х3:
При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы v1=v2=(n-C-2m)/2. Тогда,
6) Если , то гипотеза об отсутствии гетероскедастичности отклоняется ( - выбранный уровень значимости).
По проведенным расчетам в обоих случаях (и для х2, и для х3) мы получили, что следовательно в ряду остатков обнаружена гетероскедастичность.
14.3. Тест ранговой корреляции Спирмена
Значения хi и ui ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:
где di - разность между рангами хi и ui, i = 1, 2, ..., n;
n - число наблюдений.
Рассчитаем теоретические значения для x2 по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (Таблица 8).
№ п/п |
y |
x2 |
Теоритическое y |
Остатки |
Модуль остатков |
Ранг x |
Ранг u |
d2 |
1 |
45,4 |
5 |
45,768 |
-0,368 |
0,368 |
1 |
11 |
100 |
2 |
44,1 |
5,8 |
45,780 |
-1,680 |
1,680 |
2 |
22 |
400 |
3 |
45,6 |
6,8 |
45,795 |
-0,195 |
0,195 |
3 |
6 |
9 |
4 |
45,8 |
11,5 |
45,864 |
-0,064 |
0,064 |
4 |
2 |
4 |
5 |
46,7 |
17,3 |
45,949 |
0,751 |
0,751 |
5 |
17 |
144 |
6 |
46,3 |
20,9 |
46,002 |
0,298 |
0,298 |
6 |
9 |
9 |
7 |
45,7 |
20,9 |
46,002 |
-0,302 |
0,302 |
6 |
10 |
16 |
8 |
45,9 |
24,8 |
46,059 |
-0,159 |
0,159 |
7 |
4 |
9 |
9 |
46,3 |
28,8 |
46,118 |
0,182 |
0,182 |
8 |
5 |
9 |
10 |
46,3 |
31 |
46,150 |
0,150 |
0,150 |
9 |
3 |
36 |
11 |
47 |
41,4 |
46,303 |
0,697 |
0,697 |
10 |
16 |
36 |
12 |
46,9 |
42,8 |
46,324 |
0,576 |
0,576 |
11 |
15 |
16 |
13 |
45,4 |
43,9 |
46,340 |
-0,940 |
0,940 |
12 |
20 |
64 |
14 |
46,4 |
45,4 |
46,362 |
0,038 |
0,038 |
13 |
1 |
144 |
15 |
46,8 |
46,8 |
46,383 |
0,417 |
0,417 |
14 |
13 |
1 |
16 |
46,9 |
47,5 |
46,393 |
0,507 |
0,507 |
15 |
14 |
1 |
17 |
46,7 |
49,3 |
46,419 |
0,281 |
0,281 |
16 |
8 |
64 |
18 |
46,1 |
54 |
46,488 |
-0,388 |
0,388 |
17 |
12 |
25 |
19 |
45,7 |
66,6 |
46,673 |
-0,973 |
0,973 |
18 |
21 |
9 |
20 |
45,9 |
68 |
46,694 |
-0,794 |
0,794 |
19 |
19 |
0 |
21 |
46,9 |
68 |
46,694 |
0,206 |
0,206 |
19 |
7 |
144 |
22 |
46,6 |
72,4 |
46,759 |
-0,159 |
0,159 |
20 |
4 |
256 |
23 |
47,6 |
78,5 |
46,848 |
0,752 |
0,752 |
21 |
18 |
9 |
24 |
51,9 |
218,2 |
48,901 |
2,999 |
2,999 |
22 |
24 |
4 |
25 |
49,1 |
356,4 |
50,932 |
-1,832 |
1,832 |
23 |
23 |
0 |
Сумма: |
1509 |
Таблица 8 – Расчетная таблица для проведения теста Спирмена для x2
Тогда
В нашем примере статистика Стьюдента равна:
Табличное значение статистики Стьюдента составит t(0,05; 23)=2,0687.
Таким образом, мы получили, что расчетное значение больше табличного, следовательно, гипотеза о гетероскедастичности принимается на уровне значимости 5%.
Рассчитаем теоретические значения для x3 по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (таблица 9).
№ п/п |
y |
x3 |
Теоритическое y |
Остатки |
Модуль остатков |
Ранг x |
Ранг u |
d2 |
1 |
45,4 |
1,2 |
45,680 |
-0,280 |
0,280 |
1 |
9 |
64 |
2 |
45,6 |
6,7 |
45,831 |
-0,231 |
0,231 |
2 |
7 |
25 |
3 |
45,7 |
7 |
45,840 |
-0,140 |
0,140 |
3 |
6 |
9 |
4 |
46,3 |
7,8 |
45,862 |
0,438 |
0,438 |
4 |
11 |
49 |
5 |
45,8 |
9,7 |
45,914 |
-0,114 |
0,114 |
5 |
4 |
1 |
6 |
46,9 |
12,4 |
45,988 |
0,912 |
0,912 |
6 |
21 |
225 |
7 |
45,9 |
12,5 |
45,991 |
-0,091 |
0,091 |
6 |
3 |
9 |
8 |
46,7 |
14,6 |
46,049 |
0,651 |
0,651 |
7 |
15 |
64 |
9 |
46,9 |
17,2 |
46,121 |
0,779 |
0,779 |
8 |
19 |
121 |
10 |
46,9 |
17,9 |
46,140 |
0,760 |
0,760 |
9 |
18 |
81 |
11 |
46,7 |
18,8 |
46,165 |
0,535 |
0,535 |
10 |
13 |
9 |
12 |
47 |
19 |
46,170 |
0,830 |
0,830 |
11 |
20 |
81 |
13 |
46,3 |
20,5 |
46,212 |
0,088 |
0,088 |
12 |
2 |
100 |
14 |
45,7 |
23,4 |
46,292 |
-0,592 |
0,592 |
13 |
14 |
1 |
15 |
46,6 |
24,8 |
46,330 |
0,270 |
0,270 |
14 |
8 |
36 |
16 |
45,9 |
27,8 |
46,413 |
-0,513 |
0,513 |
15 |
12 |
9 |
17 |
46,3 |
28 |
46,418 |
-0,118 |
0,118 |
16 |
5 |
121 |
18 |
45,4 |
30,5 |
46,487 |
-1,087 |
1,087 |
17 |
23 |
36 |
19 |
47,6 |
30,7 |
46,493 |
1,107 |
1,107 |
18 |
24 |
36 |
20 |
44,1 |
38 |
46,694 |
-2,594 |
2,594 |
19 |
25 |
36 |
21 |
46,1 |
40,6 |
46,766 |
-0,666 |
0,666 |
19 |
16 |
9 |
22 |
46,8 |
41,2 |
46,782 |
0,018 |
0,018 |
20 |
1 |
361 |
23 |
46,4 |
61,5 |
47,342 |
-0,942 |
0,942 |
21 |
22 |
1 |
24 |
49,1 |
100,6 |
48,419 |
0,681 |
0,681 |
22 |
17 |
25 |
25 |
51,9 |
216,1 |
51,602 |
0,298 |
0,298 |
23 |
10 |
169 |
Сумма: |
1678 |
Таблица 9 – Расчетная таблица для проведения теста Спирмена для x3
Тогда
В нашем примере статистика Стьюдента равна:
Табличное значение статистики Стьюдента составит t(0,05; 23)=2,0687.
Таким образом, мы получили, что расчетное значение меньше табличного, следовательно, гипотеза об отсутствии гетероскедастичности принимается на уровне значимости 5%.
14.4. Тест Уайта (White test).
Тест Уайта
позволяет оценить
,
где - нормально распределенная ошибка.
Рисунок 12 – Вывод итогов вспомогательной регрессии теста Уайта
Оцениваем вспомогательную регрессию;
Гипотеза об отсутствии гетероскедастичности принимается в случае незначимости регрессии в целом.
В нашем примере вспомогательная регрессия принимает вид:
Уравнение статистически незначимо на уровне значимости . Следовательно, гипотеза об отсутствии гетероскедастичности принимается.
15. По всем проведенным тестам можно сделать вывод о гомоскедастичности регрессионных остатков. В противном случае для устранения гетероскедастичности необходимо применить к исходным данным обобщенный метод наименьших квадратов в предположении, что .
Рисунок 13 – Вывод итога ОМНК
Исходное уравнение
Получены новые оценки параметров линейного уравнения, в котором смягчена гетероскедастичность.
16.1. Метод рядов
Последовательно определяются знаки остатков .
Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.
Пусть n — объем выборки;
n1 — общее количество знаков «+» при n наблюдениях;
n2 — общее количество знаков «-» при n наблюдениях;
k — количество рядов.
Если при достаточно большом количестве наблюдений (n1>10, n2>10) количество рядов k лежит в пределах от k1 до k2:
то гипотеза об отсутствии автокорреляции не отклоняется.
Рисунок 14 – Расчет характеристик метода рядов
Найдя знаки отклонений теоретических уровней от фактических, мы получили, что в анализируемой выборке содержится 15 рядов, т.е. k=15 (рисунок 11). Общее количество знаков «+» n1=14, количество знаков «-» n2=11.
Подставим найденные значения в формулу, получим, что k1=7,509, k2=19,131. Следовательно, гипотеза об отсутствии автокорреляции не отклоняется.
16.2. Критерий Дарбина – Уотсона
Для проверки автокорреляции первого порядка необходимо рассчитать критерий Дарбина—Уотсона. Он определяется так:
Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. При сравнении расчетного значения статистики (DW<2) с dl и du возможны следующие варианты.
При DW > 2, то с табличными значениями сравнивается величина (4-DW).
Рисунок 15 – Расчет критерия Дарбина – Уотсона
В результате проведенных расчетов получено значение критерия Дарбина – Уотсона DW=2,203 (рисунок 12). Так как оно больше 2, то с критическими значением сравниваем величину 4-DW=1,797. Оно больше du следовательно мы не можем отвергнуть гипотезу Н0 – в ряду остатков отсутствует автокорреляция первого порядка.
16.3. Q-тест Льюинга – Бокса
Использование данного теста предполагает использование Q- статистики, значение которой определяется по формуле:
где - выборочные значения автокорреляционной функции;
- величина лага;
n – число наблюдений.
Q- статистика имеет - распределение с степенями свободы. Если Q - статистика меньше табличного , то гипотеза об отсутствии автокорреляции принимается.
Рассчитаем для нашей задачи Q- статистику. Для этого необходимо определить коэффициенты автокорреляции. Максимальная величина лага не должна превышать ¼ числа наблюдений, т.е. в рассматриваемом примере . Следовательно нужно определить автокорреляции до шестого порядка. (рисунок 16).
Рисунок 16 – Расчет Q-статистики Льюинга - Бокса
Информация о работе Расчетно-графическое задание по курсу "Эконометрики"