Автор работы: Пользователь скрыл имя, 23 Мая 2013 в 18:11, контрольная работа
Задание 1
1.Составить уравнение линейной регрессии , используя МНК, и найти числовые характеристики переменных.
2.Составить уравнение линейной регрессии , используя матричный метод.
3.Вычислить коэффициент корреляции и оценить полученное уравнение регрессии.
4.Найти оценки параметров .
5.Найти параметры нормального распределения для статистик и .
6.Найти доверительные интервалы для и на основании оценок и при уровне значимости α = 0,05.
7.Вычислить коэффициент детерминации и оценить качество выбранного уравнения регрессии.
Задания контрольной работы
Задание 1
Вариант 4
Имеются данные по десяти заводам одной отрасли промышленности об уровнях энерговооруженности труда Х (тыс. кВт/ч) и об уровне производительности труда одного рабочего в год Y (тыс. шт. изд.):
X |
9,4 |
6,0 |
6,1 |
7,2 |
6,8 |
9,4 |
10,5 |
11,4 |
11,5 |
12,1 |
Y |
5 |
2 |
7 |
4 |
6 |
5 |
7 |
8 |
9 |
8 |
Решение:
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β - используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
x |
y |
x 2 |
y 2 |
x ∙ y |
yx |
(y-y cp) 2 |
(y-yx)2 |
(x-x p) 2 |
9.4 |
5 |
88.36 |
25 |
47 |
6.33 |
1.21 |
1.77 |
0.13 |
6 |
2 |
36 |
4 |
12 |
4.15 |
16.81 |
4.62 |
9.24 |
6.1 |
7 |
37.21 |
49 |
42.7 |
4.21 |
0.81 |
7.76 |
8.64 |
7.2 |
4 |
51.84 |
16 |
28.8 |
4.92 |
4.41 |
0.85 |
3.39 |
6.8 |
6 |
46.24 |
36 |
40.8 |
4.66 |
0.01 |
1.79 |
5.02 |
9.4 |
5 |
88.36 |
25 |
47 |
6.33 |
1.21 |
1.77 |
0.13 |
10.5 |
7 |
110.25 |
49 |
73.5 |
7.04 |
0.81 |
0 |
2.13 |
11.4 |
8 |
129.96 |
64 |
91.2 |
7.61 |
3.61 |
0.15 |
5.57 |
11.50 |
9 |
132.25 |
81 |
103.5 |
7.68 |
8.41 |
1.75 |
6.05 |
12.1 |
8 |
146.41 |
64 |
96.8 |
8.06 |
3.61 |
0 |
9.36 |
90.4 |
61 |
866.88 |
413 |
583.3 |
61 |
40.9 |
20.46 |
49.66 |
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а и подставим во второе уравнение
Получаем b = 0.64, a = 0.3
Уравнение регрессии:
y = 0.64 x + 0.3
Средние значения
Дисперсия
Среднеквадратическое
Коэффициент корреляции
Связь между признаком Y фактором X сильная и прямая
Коэффициент детерминации
R 2= 0.71 2 = 0.5
т.е. в 50% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии – средняя. Остальные 50% изменений – влияние неучтенных факторов.
Находим оценки параметров коэффициентов регрессии.
- стандартная ошибка оценки (стандартная ошибка регрессии).
- стандартное отклонение случайной величины b.
Sa = 0.2269 - стандартное отклонение случайной величины a.
Проверка гипотез относительно
коэффициентов линейного
1) t-статистика для нормального распределения
> 1,86
Статистическая значимость коэффициента регрессии a подтверждается.
< 1,86
Статистическая значимость коэффициента регрессии b не подтверждается.
Доверительный интервал для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(a - t a S a; a + t a S a)
(0.2194;1.0636)
(b - t b S b; b + t b S b)
(-3.6293;4.2308)
Значимость общего уравнения регрессии.
Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fkp = 5.32
Поскольку F > Fkp, то коэффициент детерминации статистически значим
Решаем матричным методом
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор получается из выражения:
s = (XTX)-1XTY
Матрица X
1 |
9.4 |
1 |
6 |
1 |
6.1 |
1 |
7.2 |
1 |
6.8 |
1 |
9.4 |
1 |
10.5 |
1 |
11.4 |
1 |
11.50 |
1 |
12.1 |
Матрица Y
5 |
2 |
7 |
4 |
6 |
5 |
7 |
8 |
9 |
8 |
Матрица XT
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
9.4 |
6 |
6.1 |
7.2 |
6.8 |
9.4 |
10.5 |
11.4 |
11.50 |
12.1 |
Умножаем матрицы, (XTX)
В матрице, (XTX) число 10, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Умножаем матрицы, (XTY)
Находим определитель det(XTX)T = 496.64
Находим обратную матрицу (XTX)-1
Вектор оценок коэффициентов регрессии равен
Уравнение регрессии (оценка уравнения регрессии)
Y = 0.3007 + 0.6415X
Задание 2
Вариант 4
По предприятиям отрасли получены следующие результаты анализа зависимости объёма выпуска продукции Y (млн руб.) от численности занятых на предприятии Х1 (тыс. чел.) и среднегодовой стоимости основных фондов Х2 (млн руб.):
№ п/п |
Y |
Х1 |
Х2 |
1 |
1,2 |
2,0 |
0,5 |
2 |
1,4 |
2,1 |
0,6 |
3 |
2,0 |
3,0 |
0,8 |
4 |
1,8 |
2,5 |
0,4 |
5 |
1,6 |
2,4 |
0,5 |
Решение:
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор получается из выражения: s = (XTX)-1XTY
Матрица X
1 |
2.0 |
0.5 |
1 |
2.1 |
0.6 |
1 |
3.0 |
0.8 |
1 |
2.5 |
0.4 |
1 |
2.4 |
0.5 |
Матрица Y
1.2 |
1.4 |
2.0 |
1.8 |
1.6 |
Матрица XT
1 |
1 |
1 |
1 |
1 |
2.0 |
2.1 |
3.0 |
2.5 |
2.4 |
0.5 |
0.6 |
0.8 |
0.4 |
0.5 |
Умножаем матрицы, (XTX)
В матрице, (XTX) число 5, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Умножаем матрицы, (XTY)
Находим определитель det(XTX)T = 0.19
Находим обратную матрицу (XTX)-1
Вектор оценок коэффициентов регрессии равен
Уравнение регрессии (оценка уравнения регрессии)
Y = -0.2496 + 0.8803X 1-0.4701X 2
Несмещенная ошибка e = Y - X*s (абсолютная ошибка аппроксимации)
-0.08 |
0.08 |
-0.02 |
0.04 |
-0.03 |
se2 = (Y - X*s)T(Y - X*s)
Несмещенная оценка дисперсии равна
Оценка среднеквадратичного отклонения равна
Найдем оценку ковариационной матрицы вектора k = a*(XTX)-1
Дисперсии параметров модели определяются соотношением S 2i = Kii, т.е. это элементы, лежащие на главной диагонали.
По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (2;0.05) = 2.92
1) t-статистика
< 2,92
Статистическая значимость коэффициента регрессии b0 не подтверждается
< 2,92
Статистическая значимость коэффициента регрессии b1 не подтверждается
< 2,92
Статистическая значимость коэффициента регрессии b2 не подтверждается
Доверительный интервал для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(bi - t i S i; bi + t i S i)
b 0: (-3.095;2.5959)
b 1: (-0.5671;2.3278)
b 2: (-4.2277;3.2875)
2) F-статистика. Критерий Фишера
Fkp = 19.2
Поскольку F < Fkp, то коэффициент
детерминации статистически не значим
и уравнение регрессии
Оценим статистическую значимость между переменными xi
Число наблюдений n = 5. Число независимых переменных в модели равно 2, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (5 х 4). Матрица ХT Х определяется непосредственным умножением или по следующим предварительно вычисленным суммам.
Матрица составленная из Y и X
1 |
1.2 |
2 |
0.5 |
1 |
1.4 |
2.1 |
0.6 |
1 |
2 |
3 |
0.8 |
1 |
1.8 |
2.5 |
0.4 |
1 |
1.6 |
2.4 |
0.5 |
Транспонированная матрица.
1 |
1 |
1 |
1 |
1 |
1.2 |
1.4 |
2 |
1.8 |
1.6 |
2 |
2.1 |
3 |
2.5 |
2.4 |
0.5 |
0.6 |
0.8 |
0.4 |
0.5 |