Факторні ознаки

Автор работы: Пользователь скрыл имя, 13 Мая 2013 в 21:19, лабораторная работа

Описание работы

За даними спостереження двадцяти митних установ необхідно дослідити можливу залежність між витратами на їх утримання (факторна ознака Х) та перерахуваннями коштів до держбюджету (результативна ознака Y). Дослідження провести методами: комбінаційного групування, аналітичного групування, дисперсійного аналізу, КРА, збігу знаків, кореляції рангів Спірмена. При цьому метод КРА слід реалізувати для двох видів рівняння регресії, вибравши з них краще за критерієм мінімума регресійної дисперсії.

Файлы: 1 файл

Lab_3_19_20.docx

— 179.58 Кб (Скачать файл)

Постановка задачі

За даними спостереження  двадцяти митних установ необхідно  дослідити можливу залежність між  витратами на їх утримання (факторна ознака Х) та перерахуваннями коштів до держбюджету (результативна ознака Y). Дослідження провести методами: комбінаційного групування, аналітичного групування, дисперсійного аналізу, КРА, збігу знаків, кореляції рангів Спірмена. При цьому метод КРА слід реалізувати для двох видів рівняння регресії, вибравши з них краще за критерієм мінімума регресійної дисперсії.

Вихідні дані: за значення хі та уі (і= ) приймаємо числа, які знаходяться у стовпцях з номерами відповідно L1 = (е+k) та L2 = L1+1 таблиці додатка 1, де е – порядковий номер виконавця у журналі академічної групи за поточний семестр; число задає викладач; n=min{l, m}, де l та m – кількість чисел у вищевказаних стовпцях; якщо (е+k)>30, то L1 = е+k – 30;

k ≤ 20. Якщо L1 = 30, то L2 = 1.

 

i=2; k=17

L1 = (е+k)=19 та L2 = L1+1=20

 

Таблиця 1

Витрати на утримання та перерахування  митних установ

Номер митної установи (і)

Витрати на утримання (хі)

Перерахування до бюджету (уі)

1

42

0,8

2

41,3

1,2

3

43,6

0,9

4

44,1

1,1

5

47,2

1,3

6

45,6

1,2

7

46,3

1,1

8

47,9

1,4

9

49,1

1,4

10

50,2

1,5

11

50,3

1,4

12

52,1

1,6

13

52,6

1,8

14

55

1,9

15

54,2

2,1

16

56,3

2,3

17

57,4

2,6

18

58,9

2,7

19

59,6

2,6

20

59,9

3


 

Розв’язування задачі

  1. Метод комбінаційного групування.

Проведемо комбінаційне групування сукупності, що вивчається, за факторною і результативною ознаками. При цьому бажано розділити  всі вибіркові значення ознак Х та Y на групи найбільш раціональним способом, забезпечивши максимально можливу однорідність ознак у кожній групі. Це можна зробити шляхом візуального аналізу структури вибірок, побудувавши точки хі та уі на осях відповідно ох та оу. Зважаючи на необхідність побудови кореляційного поля для вибору виду рівняння регресії при дослідженні (майбутньому) залежності Y від Х методом КРА, будемо будувати точки хі та уі не на окремо взятих осях, а на осях прямокутної декартової системи координат х0у (рис. 1):

Рис. 1. Кореляційне поле

Із рис. 1 видно, що одним із раціональних способів поділу значень хі та уі на групи і відповідного комбінаційного групування є групування, наведене в таблиці співзалежності:

Таблиця 2

Комбінаційне групування за факторною (Х)  
та результативною (Y) ознаками

 

 

j

1

2

3

4

і

Х             Y

до 1,35

1,35;1,9

1,9;2,45

[2,45; 3]

1

до 47

6

0

0

0

6

2

47;54

1

6

0

0

7

3

54 і більше

0

0

3

4

7

7

6

3

4

20


 

Із  таблиці 1 видно, що майже всі ненульові  частоти fij розташовані на головній діагоналі таблиці (тобто між лівим верхнім і правим нижнім її кутами). Це дає підстави припустити наявність прямого зв’язку між витратами на утримання та перерахуваннями до бюджету.

Оскільки  не виключено, що такий розподіл частот є випадковим, перевіримо істотність зв’язку за критерієм Пірсона на рівні значущості :


=34,7

 

 

Оскільки  , то з надійністю (або 95%) можна вважати, що перерахування до бюджету істотно залежать від витрат на утримання митних установ.

Для оцінки щільності залежності обчислимо  спостережене значення коефіцієнта  спряженості Крамера для :

=0,931

Обчислене значення належить множині , де

і є  дуже близьким до її правої межі. Тому залежність з надійністю 95% будемо вважати  помірною, хоча і близькою до високої.

За  результатами дослідження, проведеного  методом комбінаційного групування, робимо висновок: між витратами на утримання і перерахуваннями  до бюджету існує пряма помірна (але близька до високої) залежність.

  1. Метод аналітичного групування

Розділимо задану сукупність пар (хі; уі) на групи за факторною ознакою Х, використавши поділ, вже зроблений у таблиці 2. В результаті одержимо групи (тобто, інтервали) пар (хі; уі), наведені в таблиці 3.

Для кожної з 3-х  груп обчислимо групові середні  та (k= ) і приймаємо за значення хk факторної ознаки Х:

 

Таблиця 3

Робоча таблиця

№ гр.(k)

Інтервал значень Х

Пари (хі; уі)

 

і

1

2

3

4

5

6

7

8

9

10

11

1

[40; 47)

хі

41,3

42

43,6

44,1

45,6

46,3

   

 

уі

1,2

0,8

0,9

1,1

1,2

1,1

   

 

2

[47;54)

хі

47,2

47,9

49,1

50,2

50,3

52,1

52,6

       

уі

1,3

1,4

1,4

1,5

1,4

1,6

1,8

       

3

[54 ; 61]

хі

54,2

55

56,3

57,4

58,9

59,6

         

уі

2,1

1,9

2,3

2,6

2,7

2,6

         

 

Знайдені значення хk факторної ознаки Х та відповідні середні значення результативної ознаки Y заносимо в таблицю 4, яка й буде являти собою лінію регресії, задану таблично:

Таблиця 4

Таблично задана лінія регресії

 

k

xk

1

43,817

1,050

2

49,915

1,067

3

57,329

1,167


 

Для наочності побудуємо графік лінії  регресії. Для цього в прямокутній  системі координат  зобразимо точки з координатами (xk ) (тобто кореляційне поле) і послідовно сполучимо їх відрізками прямих.

Із аналізу таблиці  4і графіка (рис. 2) можна зробити такий висновок: більшим витратам на утримання відповідають більші перерахування до бюджету, що підтверджує попередній висновок про можливість існування прямого зв’язку між Х та Y, зроблений за результатами комбінаційного групування. При цьому із вигляду графіка можна припустити, що зростання Y має, можливо, сповільнений характер.

 

Рис. 2. Графік таблично заданої лінії регресії

 

 

  1. Метод дисперсійного аналізу

Усю сукупність 20-ти пар (хі; уі), що вивчається, розділимо за факторною ознакою на 3 групи, використавши поділ, зроблений у таблиці 3. Обчислимо загальну середню для всієї сукупності значень уі (і= ):

=1,695.

Обчислимо загальну дисперсію ознаки Y:

=0,402.

Обчислимо міжгрупову дисперсію, використавши раніше знайдені значення групових середніх і частот fk

=0,361.

Обчислюємо спостережене значення кореляційного відношення:

=0,361/0,402=0,898

звідки  витікає, що 89,8 % загальної варіації ознаки Y пов’язано з варіацією ознаки Х, а це свідчить про можливість існування залежності Y від Х.

Для формального  підтвердження або спростування даного припущення знайдемо критичне значення величини η2 для рівня значущості . За таблицею критичних значень для степенів вільності k1=m–1=3–1=2, k2=n–m=20–3=17 знаходимо =0,297. Оскільки , то з імовірністю =0,95 можна вважати, що Y істотно залежить від Х. Для оцінки щільності зв’язку застосовуємо правило трисекції: 0,7 + 0,3=0,508; 0,3 + 0,7=0,789. Оскільки  [  (0,3 + 0,7; 1];, то щільність зв’язку будемо вважати високою.

  1. Метод КРА

Вважатимемо, що для  вибору виду рівняння регресії (тобто, виду функції f(x)) у нас немає ніякої іншої інформації, крім заданої сукупності пар (хі; уі). Це означає, що вид функції f(x) визначатиметься тільки видом кореляційного поля, із візуального аналізу якого можна припустити, що залежність Y від Х має бути лінійною або нелінійною (зокрема, квадратичною) з незначною нелінійністю.

Для обчислення параметрів а, b, р, q, r лінійної а+bх та квадратичної р+qx+rx2 залежностей застосовуємо загальноприйнятий метод найменших квадратів

Використаємо метод найменших квадратів:

  

та

-3,612

a

0,105

b

8,158

p

-0,364

q

0,0046

r


Розв’язавши системи, одержуємо умовні рівняння регресії:

 yrл=-3,612+0,105х;           yrп=8,158-0,364x+0,0046x2

Таблиця 5

Розрахункова  таблиця

і

·

·

1

42

1764

74088

3111696

0,8

33,6

1411,2

2

41,3

1705,69

70445

2909378

1,2

49,56

2046,828

3

43,6

1900,96

82881,86

3613649

0,9

39,24

1710,864

4

44,1

1944,81

85766,12

3782286

1,1

48,51

2139,291

5

47,2

2227,84

105154

4963271

1,3

61,36

2896,192

6

45,6

2079,36

94818,82

4323738

1,2

54,72

2495,232

7

46,3

2143,69

99252,85

4595407

1,1

50,93

2358,059

8

47,9

2294,41

109902,2

5264317

1,4

67,06

3212,174

9

49,1

2410,81

118370,8

5812005

1,4

68,74

3375,134

10

50,2

2520,04

126506

6350602

1,5

75,3

3780,06

11

50,3

2530,09

127263,5

6401355

1,4

70,42

3542,126

12

52,1

2714,41

141420,8

7368022

1,6

83,36

4343,056

13

52,6

2766,76

145531,6

7654961

1,8

94,68

4980,168

14

55

3025

166375

9150625

1,9

104,5

5747,5

15

54,2

2937,64

159220,1

8629729

2,1

113,82

6169,044

16

56,3

3169,69

178453,5

10046935

2,3

129,49

7290,287

17

57,4

3294,76

189119,2

10855443

2,6

149,24

8566,376

18

58,9

3469,21

204336,5

12035418

2,7

159,03

9366,867

19

59,6

3552,16

211708,7

12617841

2,6

154,96

9235,616

20

59,9

3588,01

214921,8

12873816

3

179,7

10764,03

Σ

1014

52039

2705536

1,4E+08

33,9

Информация о работе Факторні ознаки