Автор работы: Пользователь скрыл имя, 08 Декабря 2013 в 20:17, лабораторная работа
Задание №1.
По 15 предприятиям, выпускающим один и тот же вид продукции известны значения двух признаков.
x – выпуск продукции, тыс.ед;
y – затраты на производство, млн. руб.
Требуется:
1.Построить поле корреляции и сформулировать гипотезу о форме связи;
2.Построить модель:
2.1. Линейной парной регрессии.
Задание
№1.
По 15 предприятиям, выпускающим
один и тот же вид продукции известны значения
двух признаков.
x – выпуск продукции, тыс.ед;
y – затраты на производство, млн. руб.
Требуется:
1.Построить поле корреляции и сформулировать
гипотезу о форме связи;
2.Построить модель:
2.1. Линейной парной регрессии.
Для
этого:
1. Рассчитать параметры уравнений;
2. Оценить тесноту связи с помощью коэффициента
(индекса) корреляции;
3. Оценим статическую значимость полученного
уравнения;
4. Дать с помощью среднего коэффициента
эластичности сравнительную оценку силы
связи фактора с результатом;
5. С помощью F-критерия Фишера оценить
статистическую надежность результатов
моделирования;
6. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Для уровня значимости α=0,05 определить доверительный интервал прогноза.
Дано:
№ |
x |
y |
1 |
3 |
4,2 |
2 |
3,1 |
4,5 |
3 |
2,6 |
3,7 |
4 |
2,7 |
3,8 |
5 |
2,9 |
4,1 |
6 |
2,8 |
3,9 |
7 |
2,5 |
3,4 |
8 |
2,6 |
3,6 |
9 |
2,3 |
2,7 |
10 |
3,2 |
4,4 |
11 |
3,3 |
4,4 |
12 |
3,4 |
4,6 |
13 |
3,2 |
4,4 |
14 |
2,7 |
3,8 |
15 |
2,4 |
3,2 |
Решение:
1. Строим поле корреляции.
Анализируя точки поля корреляции, предполагаем, что связь между признаками x и y может быть линейной, т.е. y=a+b*x, или нелинейной вида: y=a+b*lnx, y=a*bx. Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость y от x вида y=a+b*x, т.к. затраты на производство (y) можно условно разделить на два вида: постоянные, не зависящие от объема производства (а), такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции (b*x) такие как расход материала, электроэнергии и т.д.
2.1.
Модель линейной парной
2.1.1. Рассчитаем параметры a и b линейной
регрессии y=a+b*x. Строим расчетную таблицу.
По исходным данным рассчитываем y*x, x2, y2. Рассчитав y, x, yx, x2 и y2 определим их средние значения.
|
|
|
|
|
|
|
|
|
(у-ух)2 |
(х-х)2 |
1 |
3 |
4,2 |
12,6 |
9 |
17,64 |
4,144707 |
0,055293 |
1,316504 |
0,0030573 |
0,023511 |
2 |
3,1 |
4,5 |
13,95 |
9,61 |
20,25 |
4,295603 |
0,204397 |
4,542164 |
0,0417781 |
0,0641776 |
3 |
2,6 |
3,7 |
9,62 |
6,76 |
13,69 |
3,541124 |
0,158876 |
4,293952 |
0,0252415 |
0,0608446 |
4 |
2,7 |
3,8 |
10,26 |
7,29 |
14,44 |
3,69202 |
0,10798 |
2,841591 |
0,0116499 |
0,0215112 |
5 |
2,9 |
4,1 |
11,89 |
8,41 |
16,81 |
3,993811 |
0,106189 |
2,589974 |
0,0112761 |
0,0028444 |
6 |
2,8 |
3,9 |
10,92 |
7,84 |
15,21 |
3,842915 |
0,057085 |
1,46371 |
0,0032586 |
0,0021778 |
7 |
2,5 |
3,4 |
8,5 |
6,25 |
11,56 |
3,390228 |
0,009772 |
0,287411 |
0,0000954 |
0,120178 |
8 |
2,6 |
3,6 |
9,36 |
6,76 |
12,96 |
3,541124 |
0,058876 |
1,635451 |
0,0034663 |
0,0608446 |
9 |
2,3 |
2,7 |
6,21 |
5,29 |
7,29 |
3,088436 |
-0,38844 |
14,38654 |
0,1508825 |
0,2988448 |
10 |
3,2 |
4,4 |
14,08 |
10,24 |
19,36 |
4,446498 |
-0,0465 |
1,056781 |
0,002162 |
0,1248442 |
11 |
3,3 |
4,4 |
14,52 |
10,89 |
19,36 |
4,597394 |
-0,19739 |
4,48623 |
0,0389643 |
0,2055108 |
12 |
3,4 |
4,6 |
15,64 |
11,56 |
21,16 |
4,74829 |
-0,14829 |
3,223694 |
0,0219899 |
0,3061774 |
13 |
3,2 |
4,4 |
14,08 |
10,24 |
19,36 |
4,446498 |
-0,0465 |
1,056781 |
1,5537572 |
0,1248442 |
14 |
2,7 |
3,8 |
10,26 |
7,29 |
14,44 |
3,69202 |
0,10798 |
2,841591 |
0,0116596 |
0,0215112 |
15 |
2,4 |
3,2 |
7,68 |
5,76 |
10,24 |
3,239332 |
-0,03933 |
1,229133 |
0,001547 |
0,1995114 |
Итого: |
42,7 |
58,7 |
169,57 |
123,19 |
233,77 |
58,7 |
- |
47,2515 |
1,9101131 |
1,6373332 |
Сред.зн |
2,846667 |
3,913333 |
11,30467 |
8,212667 |
15,58467 |
3,913333 |
- |
3,1501 |
0,12734087 |
0,10915555 |
Определяем параметры b и
a:
==
=
Уравнение регрессии =-0,38+1,51*х. С увеличением выпуска продукции на 1 тыс. руб. затраты на производства увеличиваются на 1,51 млн.руб в среднем, постоянные затраты уменьшаются 0,38 млн. руб.
2.1.2.
Тесноту связи оценим с
= 15,58467-(3,913333)2=15,58467-
= 8,212667-(2,846667)2=8,212667-
= 1,508958*= 1,508958*0,63524367=0,958573
Значение rxy близко к 1, следовательно, между переменными y и x наблюдается очень тесная корреляционная связи вида y=a+b*x
2.1.3.
Оценим качество построенной
модели.
Определим коэффициент детерминации
R2= r2xy= 0,918862
т.е. данная модель объясняет 91,9% общей
дисперсии y, на долю необъясненной дисперсии
приходится 8,1%. Следовательно, качество
модели высокое.
Найдем величину средней ошибки аппроксимации
.
Предварительно определим
, подставляя в уравнение регрессии
= - 0,38+1,51*х фактические значения
x. Найдем
. Тогда
=
т.е. в среднем расчетные значении отклоняются
от фактических на 3,15%. Ошибка допустимая
(Ai10%).
2.1.4.
Определим средний коэффициент
эластичности:
== 1,508958*0,7274277=1,0976578%
Он показывает, что с увеличением выпуска
продукции на 1% затраты на производство
увеличиваются в среднем на 1,098%.
2.1.5. Оценим статическую значимость полученного уравнения.
Проверим гипотезу H0, что выявленная зависимость
y от x носит случайный характер, т.е. полученное
уравнение статически незначимо. Примем
α=0,05. Найдем табличное (критическое) значение
F-критерия Фишера.
Fтабл=(α=0,05, k1=1, k2=15-2=13)=4,67.
Найдем фактическое значение F-критерия
Фишера:
=
Fфакт>Fтабл
Поэтому гипотеза H0 о случайном характере зависимости
y от x отвергается, принимается альтернативная
гипотеза H1 – с вероятностью 0,95 выявленная
зависимость y от x носит неслучайный характер,
полученное уравнение статически значимо,
надежно и может быть использовано для
прогноза.
2.1.6. Рассчитаем прогнозное значение результата y, если прогнозное значение х увеличивается на 5% от его среднего уровня.
=2,85, хр= 2,9925
yp=
=-0,38+1,51* хр= 4,138675
Для величины выпуска продукции равной 2,9925 тыс. руб. Прогнозное значение затрат на производство составит 4,138675 млн. руб.
Для уровня значимости α=0,05
определим доверительный
mrxy=
mb= * =0,1243621
Тогда средняя стандартная ошибка прогноза:
= 0,165139
Для уровня значимости α=0,05 определим
табличное значение t-статистики Стьюдента
tтабл (α=0,05, k=15-2)=2,16
Тогда доверительный интервал прогноза
:
=3,781974
=4,495376
т.е. с вероятностью 0,95 прогнозное значение
при хр= 1,05*
принадлежит интервалу (3,781974;
4,495376).
Прогноз надежный, но не точный, т.к. интервал
достаточно широк
=1,188632