Автор работы: Пользователь скрыл имя, 16 Апреля 2013 в 13:42, контрольная работа
Исходные данные:
Составить уравнение линейной регрессии , используя МНК, и найти числовые характеристики переменных.
Составить уравнение линейной регрессии , используя матричный метод.
Вычислить коэффициент корреляции и оценить полученное уравнение регрессии.
Найти оценки параметров .
Найти параметры нормального распределения для статистик и .
Найти доверительные интервалы для и на основании оценок и при уровне значимости α = 0,05.
Вычислить коэффициент детерминации и оценить качество выбранного уравнения регрессии.
Содержание:
Исходные данные:
Имеются данные по предприятиям о производительности труда Х (шт.) и коэффициенте механизации работ Y (%):
X |
20 |
24 |
28 |
30 |
31 |
33 |
34 |
37 |
38 |
40 |
Y |
32 |
30 |
36 |
40 |
41 |
47 |
56 |
54 |
60 |
55 |
Решение
№ |
Y |
X |
X2 |
xy |
1 |
32 |
20 |
400 |
640 |
2 |
30 |
24 |
576 |
720 |
3 |
36 |
28 |
784 |
1008 |
4 |
40 |
30 |
900 |
1200 |
5 |
41 |
31 |
961 |
1271 |
6 |
47 |
33 |
1089 |
1551 |
7 |
56 |
34 |
1156 |
1904 |
8 |
54 |
37 |
1369 |
1998 |
9 |
60 |
38 |
1444 |
2280 |
10 |
55 |
40 |
1600 |
2200 |
Сум |
451 |
315 |
10279 |
14772 |
Сред |
45 |
32 |
1028 |
1477 |
Таким образом, уравнение линейной регрессии имеет вид: .
2. В матричной форме: Y=a +bX., где Y и X – соответственно матрицы значений переменных Y и X. Решая эту систему получаем:
.
3. В общем случае коэффициент корреляции рассчитывается по формуле:
,
>0.9, значит связь между
4.
a=-4.867, b=1.586
; .
;
5. Нормальное распределение будет выглядеть следующим образом:
6. Определим доверительные интервалы коэффициентов, которые с надежность 95% будут следующими:
для a (-4.87-2.9*7.35; -4.87-2.9*7.35)=(-26.18;16.5)
для b (1.59-2.9*0.23; 1.59+2.9*0.23)= (0.92;2.26)
7. Коэффициент детерминации:
F-статистика находится по формуле: .
N=10 – размер выборки, m=1 – число исследуемых факторов (фактор x)
Критическое значение Fкр= 5.32 найдено для уровня значимости α=5% и чисел степеней свободы k1=1. k2=8.
Очевидно, что 47.88>5.32, следовательно, коэффициент детерминации статистически значим, т.е. влияние переменной X на переменную Y существенно.
Исходные данные:
Анализируются зависимость объёма продукции предприятия в среднем
за год Y (млн руб.) от средней численности рабочих Х1 (тыс. чел.) и
Х2 – средние затраты чугуна за год (млн т):
№ п/п |
Y |
Х1 |
Х2 |
1 |
2,1 |
1,0 |
0,5 |
2 |
2,4 |
1,1 |
0,8 |
3 |
1,8 |
1,3 |
0,7 |
4 |
3,0 |
1,5 |
0,6 |
5 |
2,2 |
1,2 |
0,4 |
Решение
1, Для построения
парной линейной модели y = a +
Все параметры рассчитываемой модели приводить не будем, их можно будет посмотреть в файле Excel. Рассмотрим лишь коэффициенты регрессии, математические ожидание и стандартные ошибки.
Коэффициенты |
Стандартная ошибка | |
Y-пересечение |
-0,36571 |
0,834563106 |
X1 |
2,035714 |
0,55309119 |
X2 |
0,507143 |
0,725372295 |
Y =-0,366+2,036Х1+0,507Х2
2.
a=-0.366
b1=2.036
b2=0.507
σ=0.227
3. Коэффициент детерминации равен 0,87.
F-статистика находится по формуле: .
N=5 – размер выборки, m=2 – число исследуемых факторов (фактор x)
Критическое значение Fкр= 19 найдено для уровня значимости α=5% и чисел степеней свободы k1=2. k2=2.
Очевидно, что 6,69<19, следовательно, коэффициент детерминации статистически не значим, т.е. влияние переменных x1 и x2 на переменную Y несущественно. Это может быть объяснено небольшой величиной выборки.
4. Построим корреляционную
матрицу для оценки
Y |
X1 |
X2 | |
Y |
1 |
||
X1 |
0,916579 |
1 |
|
X2 |
0,035355 |
-0,1525 |
1 |
Очевидно, что наиболее тесная связь проявляется меду переменными Y и X1.