Автор работы: Пользователь скрыл имя, 08 Марта 2014 в 00:49, контрольная работа
По розташуванню точок на діаграмі розсіювання можна стверджувати, що існує певна негативна залежність між досліджуваними змінними - тобто зі збільшенням однієї змінної інша змінна зменшується. Достатньо велика кількість дослідних точок та характер їх розташування дозволяє говорити про практично однаковий крок спостережень, відсутність нетипових аномальних спостережень, перевагу закономірності над випадковістю. Тобто всі вимоги до вихідних даних виконуються. Для опису даної залежності достатньо добре підійде лінійна регресія.
Лінійний регресійний аналіз
Варіант 9 | |
y |
x1 |
126 |
2 |
90 |
5 |
92 |
7 |
65 |
10 |
52 |
12 |
40 |
15 |
25 |
18 |
15 |
20 |
8 |
22 |
0 |
23 |
По розташуванню точок на діаграмі розсіювання можна стверджувати, що існує певна негативна залежність між досліджуваними змінними - тобто зі збільшенням однієї змінної інша змінна зменшується. Достатньо велика кількість дослідних точок та характер їх розташування дозволяє говорити про практично однаковий крок спостережень, відсутність нетипових аномальних спостережень, перевагу закономірності над випадковістю. Тобто всі вимоги до вихідних даних виконуються. Для опису даної залежності достатньо добре підійде лінійна регресія.
2. Знаходження параметрів лінійних регресій за допомогою МНК.
У випадку взаємозв'язку між досліджуваними змінними ми повинні знайти дві сполучені регресії. У випадку лінійного зв'язку така залежність описується рівняннями: y=b0+b1 x, x=а0+а1y.
Застосування методу найменших квадратів вимагає розв'язання системи нормальних рівнянь:
В загальному вигляді формули для знаходження параметрів лінійних регресій мають вигляд:
Складемо розрахункову таблицю:
№ |
x |
y |
x2 |
y2 |
xy |
1 |
2 |
126 |
4 |
15876 |
252 |
2 |
5 |
90 |
25 |
8100 |
450 |
3 |
7 |
92 |
49 |
8464 |
644 |
4 |
10 |
65 |
100 |
4225 |
650 |
5 |
12 |
52 |
144 |
2704 |
624 |
6 |
15 |
40 |
225 |
1600 |
600 |
7 |
18 |
25 |
324 |
625 |
450 |
8 |
20 |
15 |
400 |
225 |
300 |
9 |
22 |
8 |
484 |
64 |
176 |
10 |
23 |
0 |
529 |
0 |
0 |
сума |
134 |
513 |
2284 |
41883 |
4146 |
b0= = 126.152 b1= =-5.586
a0== 22.391 a1= = -0.175
Отримали рівняння двох сполучених регресій:
Для побудови графіку прямої лінії достатньо двох точок. При цьому відомо, що лінійні регресії завжди проходять через центр ваги хмари експериментальних точок - точку з координатами, що дорівнюють середнім арифметичним значенням досліджуваних змінних:
= 134/10=13.4 =513/10=51.3
Перевіримо отримані нами рівняння підстановкою в них середніх значень змінних:
Y(13.4)=126.152-5.586*13.4=51.
X(51.3)=22.391-0.175*51.3=13.4
Отже, обидві прямі проходять через точку (13,2; 61,8).
В якості другої точки зручно узяти точку перетину прямої з віссю координат:
Y(0)=126.152-5.586*0=126.152
X(0)=22.391-0.0175*0=22.391
Побудуємо графіки прямих на діаграмі розсіювання:
Як видно, побудовані прямі правильно відображають досліджувану залежність. Немає дуже великих відхилень дослідних точок від прогнозних прямих. Кут між прямими дуже невеликий, що дозволяє говорити про тісний зв'язок між досліджуваними змінними.
4. Коефіцієнт детермінації.
Коефіцієнт детермінації у загальному випадку розраховується за формулою:
Для сполучених регресій відомо, що
Складемо розрахункову таблицю:
№ |
x |
y |
y- |
(y- )^2 | |||
1 |
2 |
126 |
114,98 |
63,68 |
4055,142 |
74,7 |
5580,09 |
2 |
5 |
90 |
98,222 |
46,922 |
2201,674 |
38,7 |
1497,69 |
3 |
7 |
92 |
87,05 |
35,75 |
1278,063 |
40,7 |
1656,49 |
4 |
10 |
65 |
70,292 |
18,992 |
360,6961 |
13,7 |
187,69 |
5 |
12 |
52 |
59,12 |
7,82 |
61,1524 |
0,7 |
0,49 |
6 |
15 |
40 |
42,362 |
-8,938 |
79,88784 |
-11,3 |
127,69 |
7 |
18 |
25 |
25,604 |
-25,696 |
660,2844 |
-26,3 |
691,69 |
8 |
20 |
15 |
14,432 |
-36,868 |
1359,249 |
-36,3 |
1317,69 |
9 |
22 |
8 |
3,26 |
-48,04 |
2307,842 |
-43,3 |
1874,89 |
10 |
23 |
0 |
-2,326 |
-53,626 |
2875,748 |
-51,3 |
2631,69 |
сума |
134 |
513 |
15239,74 |
15566,1 |
Отримаємо: R2= 15239.74/15566.1=0.979
Значення коефіцієнту детермінації доволі велике, що дозволяє говорити про велику точність побудованих моделей - більш ніж 97.9% зв'язку описується отриманими рівняннями. Частка впливу випадкових факторів, помилок та похибок складає менш ніж 2.1%.
5. Адекватність моделі.
Адекватність побудованої регресійної моделі визначимо за допомогою критерію Фишера:
184.92
Табличне значення критерію Фишера для випадку парної регресії й 10 проведених спостереженнях дорівнює: 5,32 - для 5% рівня значимості; 11,26 - для 1% рівня значимості. Як видно, отримане нами значення F перевищує критичне табличне значення, що дозволяє говорити про адекватність побудованої моделі реальної дійсності.
6. Висновки та економічна інтерпретація результатів.
Залежність змінної у від змінної х виражається рівнянням Y=126,152-5,586x що застосовується на інтервалі хÎ (2; 23). При цьому збільшення змінної х на одиницю приведе до зменшення змінної у на 5,586 од.
Залежність змінної х від змінної у виражається рівнянням Х=22,391-0,175у
що застосовується на інтервалі yÎ (0; 126). При цьому збільшення змінної у на одиницю приведе до зменшення змінної х на 0,175 од.
Коефіцієнт детермінації становить 97,9%, тобто вплив випадкових факторів і помилок становить 2,1%.
Значення критерію Фишера перевищує критичні табличні значення, що дозволяє говорити про адекватність побудованої моделі реальній дійсності.