Автор работы: Пользователь скрыл имя, 13 Мая 2013 в 21:19, лабораторная работа
За даними спостереження двадцяти митних установ необхідно дослідити можливу залежність між витратами на їх утримання (факторна ознака Х) та перерахуваннями коштів до держбюджету (результативна ознака Y). Дослідження провести методами: комбінаційного групування, аналітичного групування, дисперсійного аналізу, КРА, збігу знаків, кореляції рангів Спірмена. При цьому метод КРА слід реалізувати для двох видів рівняння регресії, вибравши з них краще за критерієм мінімума регресійної дисперсії.
Постановка задачі
За даними спостереження двадцяти митних установ необхідно дослідити можливу залежність між витратами на їх утримання (факторна ознака Х) та перерахуваннями коштів до держбюджету (результативна ознака Y). Дослідження провести методами: комбінаційного групування, аналітичного групування, дисперсійного аналізу, КРА, збігу знаків, кореляції рангів Спірмена. При цьому метод КРА слід реалізувати для двох видів рівняння регресії, вибравши з них краще за критерієм мінімума регресійної дисперсії.
Вихідні дані: за значення хі та уі (і= ) приймаємо числа, які знаходяться у стовпцях з номерами відповідно L1 = (е+k) та L2 = L1+1 таблиці додатка 1, де е – порядковий номер виконавця у журналі академічної групи за поточний семестр; число задає викладач; n=min{l, m}, де l та m – кількість чисел у вищевказаних стовпцях; якщо (е+k)>30, то L1 = е+k – 30;
k ≤ 20. Якщо L1 = 30, то L2 = 1.
i=2; k=17
L1 = (е+k)=19 та L2 = L1+1=20
Таблиця 1
Витрати на утримання та перерахування митних установ
Номер митної установи (і) |
Витрати на утримання (хі) |
Перерахування до бюджету (уі) |
1 |
42 |
0,8 |
2 |
41,3 |
1,2 |
3 |
43,6 |
0,9 |
4 |
44,1 |
1,1 |
5 |
47,2 |
1,3 |
6 |
45,6 |
1,2 |
7 |
46,3 |
1,1 |
8 |
47,9 |
1,4 |
9 |
49,1 |
1,4 |
10 |
50,2 |
1,5 |
11 |
50,3 |
1,4 |
12 |
52,1 |
1,6 |
13 |
52,6 |
1,8 |
14 |
55 |
1,9 |
15 |
54,2 |
2,1 |
16 |
56,3 |
2,3 |
17 |
57,4 |
2,6 |
18 |
58,9 |
2,7 |
19 |
59,6 |
2,6 |
20 |
59,9 |
3 |
Розв’язування задачі
Проведемо комбінаційне групування сукупності, що вивчається, за факторною і результативною ознаками. При цьому бажано розділити всі вибіркові значення ознак Х та Y на групи найбільш раціональним способом, забезпечивши максимально можливу однорідність ознак у кожній групі. Це можна зробити шляхом візуального аналізу структури вибірок, побудувавши точки хі та уі на осях відповідно ох та оу. Зважаючи на необхідність побудови кореляційного поля для вибору виду рівняння регресії при дослідженні (майбутньому) залежності Y від Х методом КРА, будемо будувати точки хі та уі не на окремо взятих осях, а на осях прямокутної декартової системи координат х0у (рис. 1):
Рис. 1. Кореляційне поле
Із рис. 1 видно, що одним із раціональних способів поділу значень хі та уі на групи і відповідного комбінаційного групування є групування, наведене в таблиці співзалежності:
Таблиця 2
Комбінаційне групування за факторною
(Х)
та результативною (Y) ознаками
j |
1 |
2 |
3 |
4 |
||
і |
Х Y |
до 1,35 |
1,35;1,9 |
1,9;2,45 |
[2,45; 3] | |
1 |
до 47 |
6 |
0 |
0 |
0 |
6 |
2 |
47;54 |
1 |
6 |
0 |
0 |
7 |
3 |
54 і більше |
0 |
0 |
3 |
4 |
7 |
7 |
6 |
3 |
4 |
20 |
Із таблиці 1 видно, що майже всі ненульові частоти fij розташовані на головній діагоналі таблиці (тобто між лівим верхнім і правим нижнім її кутами). Це дає підстави припустити наявність прямого зв’язку між витратами на утримання та перерахуваннями до бюджету.
Оскільки не виключено, що такий розподіл частот є випадковим, перевіримо істотність зв’язку за критерієм Пірсона на рівні значущості :
=34,7
Оскільки , то з надійністю (або 95%) можна вважати, що перерахування до бюджету істотно залежать від витрат на утримання митних установ.
Для оцінки щільності залежності обчислимо спостережене значення коефіцієнта спряженості Крамера для :
=0,931
Обчислене значення належить множині , де
і є дуже близьким до її правої межі. Тому залежність з надійністю 95% будемо вважати помірною, хоча і близькою до високої.
За результатами дослідження, проведеного методом комбінаційного групування, робимо висновок: між витратами на утримання і перерахуваннями до бюджету існує пряма помірна (але близька до високої) залежність.
Розділимо задану сукупність пар (хі; уі) на групи за факторною ознакою Х, використавши поділ, вже зроблений у таблиці 2. В результаті одержимо групи (тобто, інтервали) пар (хі; уі), наведені в таблиці 3.
Для кожної з 3-х груп обчислимо групові середні та (k= ) і приймаємо за значення хk факторної ознаки Х:
Таблиця 3
Робоча таблиця
№ гр.(k) |
Інтервал значень Х |
Пари (хі; уі) |
|||||||||||
і |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 | ||
1 |
[40; 47) |
хі |
41,3 |
42 |
43,6 |
44,1 |
45,6 |
46,3 |
– |
– |
|||
уі |
1,2 |
0,8 |
0,9 |
1,1 |
1,2 |
1,1 |
– |
– |
|||||
2 |
[47;54) |
хі |
47,2 |
47,9 |
49,1 |
50,2 |
50,3 |
52,1 |
52,6 |
||||
уі |
1,3 |
1,4 |
1,4 |
1,5 |
1,4 |
1,6 |
1,8 |
||||||
3 |
[54 ; 61] |
хі |
54,2 |
55 |
56,3 |
57,4 |
58,9 |
59,6 |
|||||
уі |
2,1 |
1,9 |
2,3 |
2,6 |
2,7 |
2,6 |
Знайдені значення хk факторної ознаки Х та відповідні середні значення результативної ознаки Y заносимо в таблицю 4, яка й буде являти собою лінію регресії, задану таблично:
Таблиця 4
Таблично задана лінія регресії
k |
xk |
|
1 |
43,817 |
1,050 |
2 |
49,915 |
1,067 |
3 |
57,329 |
1,167 |
Для наочності побудуємо графік лінії регресії. Для цього в прямокутній системі координат зобразимо точки з координатами (xk; ) (тобто кореляційне поле) і послідовно сполучимо їх відрізками прямих.
Із аналізу таблиці 4і графіка (рис. 2) можна зробити такий висновок: більшим витратам на утримання відповідають більші перерахування до бюджету, що підтверджує попередній висновок про можливість існування прямого зв’язку між Х та Y, зроблений за результатами комбінаційного групування. При цьому із вигляду графіка можна припустити, що зростання Y має, можливо, сповільнений характер.
Рис. 2. Графік таблично заданої лінії регресії
Усю сукупність 20-ти пар (хі; уі), що вивчається, розділимо за факторною ознакою на 3 групи, використавши поділ, зроблений у таблиці 3. Обчислимо загальну середню для всієї сукупності значень уі (і= ):
=1,695.
Обчислимо загальну дисперсію ознаки Y:
=0,402.
Обчислимо міжгрупову дисперсію, використавши раніше знайдені значення групових середніх і частот fk
Обчислюємо спостережене значення кореляційного відношення:
звідки витікає, що 89,8 % загальної варіації ознаки Y пов’язано з варіацією ознаки Х, а це свідчить про можливість існування залежності Y від Х.
Для формального підтвердження або спростування даного припущення знайдемо критичне значення величини η2 для рівня значущості . За таблицею критичних значень для степенів вільності k1=m–1=3–1=2, k2=n–m=20–3=17 знаходимо = =0,297. Оскільки , то з імовірністю =0,95 можна вважати, що Y істотно залежить від Х. Для оцінки щільності зв’язку застосовуємо правило трисекції: 0,7 + 0,3=0,508; 0,3 + 0,7=0,789. Оскільки [ (0,3 + 0,7; 1];, то щільність зв’язку будемо вважати високою.
Вважатимемо, що для вибору виду рівняння регресії (тобто, виду функції f(x)) у нас немає ніякої іншої інформації, крім заданої сукупності пар (хі; уі). Це означає, що вид функції f(x) визначатиметься тільки видом кореляційного поля, із візуального аналізу якого можна припустити, що залежність Y від Х має бути лінійною або нелінійною (зокрема, квадратичною) з незначною нелінійністю.
Для обчислення параметрів а, b, р, q, r лінійної а+bх та квадратичної р+qx+rx2 залежностей застосовуємо загальноприйнятий метод найменших квадратів
Використаємо метод найменших квадратів:
та
-3,612 |
a |
0,105 |
b |
8,158 |
p |
-0,364 |
q |
0,0046 |
r |
Розв’язавши системи, одержуємо умовні рівняння регресії:
yrл=-3,612+0,105х; yrп=8,158-0,364x+0,0046x2
Таблиця 5
Розрахункова таблиця
і |
|||||||
1 |
42 |
1764 |
74088 |
3111696 |
0,8 |
33,6 |
1411,2 |
2 |
41,3 |
1705,69 |
70445 |
2909378 |
1,2 |
49,56 |
2046,828 |
3 |
43,6 |
1900,96 |
82881,86 |
3613649 |
0,9 |
39,24 |
1710,864 |
4 |
44,1 |
1944,81 |
85766,12 |
3782286 |
1,1 |
48,51 |
2139,291 |
5 |
47,2 |
2227,84 |
105154 |
4963271 |
1,3 |
61,36 |
2896,192 |
6 |
45,6 |
2079,36 |
94818,82 |
4323738 |
1,2 |
54,72 |
2495,232 |
7 |
46,3 |
2143,69 |
99252,85 |
4595407 |
1,1 |
50,93 |
2358,059 |
8 |
47,9 |
2294,41 |
109902,2 |
5264317 |
1,4 |
67,06 |
3212,174 |
9 |
49,1 |
2410,81 |
118370,8 |
5812005 |
1,4 |
68,74 |
3375,134 |
10 |
50,2 |
2520,04 |
126506 |
6350602 |
1,5 |
75,3 |
3780,06 |
11 |
50,3 |
2530,09 |
127263,5 |
6401355 |
1,4 |
70,42 |
3542,126 |
12 |
52,1 |
2714,41 |
141420,8 |
7368022 |
1,6 |
83,36 |
4343,056 |
13 |
52,6 |
2766,76 |
145531,6 |
7654961 |
1,8 |
94,68 |
4980,168 |
14 |
55 |
3025 |
166375 |
9150625 |
1,9 |
104,5 |
5747,5 |
15 |
54,2 |
2937,64 |
159220,1 |
8629729 |
2,1 |
113,82 |
6169,044 |
16 |
56,3 |
3169,69 |
178453,5 |
10046935 |
2,3 |
129,49 |
7290,287 |
17 |
57,4 |
3294,76 |
189119,2 |
10855443 |
2,6 |
149,24 |
8566,376 |
18 |
58,9 |
3469,21 |
204336,5 |
12035418 |
2,7 |
159,03 |
9366,867 |
19 |
59,6 |
3552,16 |
211708,7 |
12617841 |
2,6 |
154,96 |
9235,616 |
20 |
59,9 |
3588,01 |
214921,8 |
12873816 |
3 |
179,7 |
10764,03 |
Σ |
1014 |
52039 |
2705536 |
1,4E+08 |
33,9 |