Кореляционно-регрессионный анализ

Автор работы: Пользователь скрыл имя, 03 Марта 2013 в 21:09, контрольная работа

Описание работы

Задание № 1.
Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.
Задание №2. а) Корреляционный анализ данных.
Прибыль (убыток) – это зависимая переменная Y (тыс. руб.).
Независимые, объясняющие переменные:
X1 – долгосрочные обязательства, руб.;
X4 – основные средства, руб.;
X5 – дебиторская задолженность (краткосрочные), руб.
Количество наблюдений n = 50, количество объясняющих переменных m = 3.

Файлы: 1 файл

конт.раб света.docx

— 5.91 Мб (Скачать файл)

 

На основании данных, приведенных  в табл. 1:

1. Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.

2. Осуществите двумя способами выбор факторных признаков для построения регрессионной модели:

а) на основе анализа матрицы  коэффициентов парной корреляции, включая  проверку гипотезы о независимости  объясняющих переменных (тест на выявление  мультиколлинеарности Фаррара–Глоубера);

б) с помощью пошагового отбора методом исключения.

3. Постройте уравнение множественной регрессии в линейной форме с выбранными факторами. Дайте экономическую интерпретацию коэффициентов модели регрессии.

4. Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, b- и D-коэффициентов.

5. Рассчитайте параметры линейной парной регрессии для наиболее подходящего фактора Хj.

6. Оцените качество построенной модели с помощью коэффициента детерминации, F-критерия Фишера.

7. Проверьте выполнение условия гомоскедастичности.

8. Используя результаты регрессионного анализа ранжируйте компании по степени эффективности.

9. Осуществите прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора Хj составит 80% от его максимального значения. Представьте на графике фактические данные Y, результаты моделирования, прогнозные оценки и границы доверительного интервала.

10. Составьте уравнения нелинейной регрессии:

а) гиперболической;

б) степенной;

в) показательной.

11. Приведите графики построенных уравнений регрессии.

12. Для нелинейных моделей найдите коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравните модели по этим характеристикам и сделайте вывод о лучшей модели.

 

 

 

 

Таблица 1. Исходные данные

ОАО по добыче сырой нефти  и природного газа; предоставление услуг в этих областях

№ п/п

Прибыль (убыток)

Долгосрочные обязательства

Основные средства

Дебиторская задолженность (краткосрочная)

Y

Х1

Х4

Х5

Аганнефтегазгеология, ОАО, многопрофильная компания

1

1 440 075

61 749

5 165 712

3 490 541

Азнакаевский горизонт, ОАО

2

5 146

17 532

19 595

23 014

Акмай,ОАО

3

13 612

20 268

81 072

8 678

Аксоль, ОАО, производственно-коммерческая фирма

4

964

211

8 446

4 821

Акционерная нефтяная компания "Башнефть", ОАО

5

19 513 178

52 034 182

47 002 385

23 780 450

АЛРОСА-Газ, ОАО

6

28 973

602 229

1 545 052

204 181

Арктическая газовая компания,ОАО

7

-780 599

311 268

740 437

1 456 438

Барьеганнефтегаз, ОАО

8

2 598 165

464 651

11 925 177

5 566 412

Белкамнефть,ОАО

9

628 091

214 411

2 580 485

4 285 041

Белорусское управление по повышению нефтеотдачи пластов и капитальному ремонту скважин, ОАО

10

29 204

12 039

269 908

624 393

Битран, ОАО

11

1 945 560

9 670

229 855

2 918 345

Богородскнефть, ОАО

12

366 170

287 992

349 643

484 537

Братсэкогаз, ОАО

13

-20 493

1 105 293

934 881

9 865

Булгарнефть,ОАО

14

381 558

27 265

697 664

196 045

Варьеганнефть,ОАО

15

1 225 908

431 231

2 231 651

1 095 263

Верхнечонскнефтьгаз, ОАО

16

3 293 989

37 315 847

23 170 344

2 477 424

Восточная транснациональная компания,ОАО

17

416 616

2 122 138

3 509 537

48 174

Восточно-Сибирская нефтегазовая,ОАО

18

-564 258

1 395 080

1 290 245

286 058

Геолого-разведочный исследовательский центр,ОАО

19

221 194

13 429

607 249

72 854

Грознефтьгаз,ОАО

20

701 035

75 554

4 616 250

1 304 084

Губкинский газоперерабатывающий комплекс,ОАО

21

62 200

22 195

991 114

294 575

Дагнефтьгаз,ОАО

22

123 440

12 350

438 262

44 889

Елабуганефть,ОАО

23

55 528

14 686

75 442

24 275

Иделойл,ОАО

24

422 070

52 443

1 269 731

140 535

Избербашнефть,ОАО

25

-468

239 255

10 870

114 444

Инвестиционная нефтяная компания,ОАО

26

225 452

1 292

227 132

272 147

Инга,ОАО

27

-61 237

924 951

110 970

76 561

Каббалкнефть,ОАО

28

-540

0

21 278

25 017

Калининграднефть,ОАО

29

40 588

1 638

139 209

18 072

Камчатгазпром,ОАО

30

53 182

54 758

113 113

496 994

Кировское нефтегазодобывающееуправление,ОАО

31

-210

8

12 685

602

Когалымнефтепрогресс,ОАО

32

63 058

235 731

873 886

474 612

Комнедра,ОАО

33

1 197 196

2 232 742

2 307 478

1 040 387

Кондурчанефть,ОАО

34

221 177

4 682

331 954

55 155

Корпорация"Югранефть",ОАО

35

1 548 768

84 262

1 138 707

7 613 662

Краснодарское опытно-экспериментальное  управление по повышению нефтеотдачи пластов и капитальному ремонту скважин,ОАО

36

-33 030

106

16 705

5 038

Ленинграсланец,ОАО

37

-34 929

103 567

393 717

61 353

Меллянефть,ОАО

38

115 847

275 386

517 290

122 062

МНКТ,ОАО

39

35 198

20 624

484 228

168 314

Мохтикнефть,ОАО

40

788 567

33 879

42 613

317 153

Научно-производственное объяединение"Спецэлектромеханика,ОАО

41

309 053

99 670

18 776

212 882

Научно-производственное предприятие"Бурсервис",ОАО

42

8 552

257

12 381

63 550

НГДУ"Пензанефть",ОАО

43

173 079

6 120

176 126

147 549

Негуснефть,ОАО

44

1 227 017

33 757

2 063 285

171 162

Ненецкая нефтяная компания,ОАО

45

701 728

381 050

59 353

237 083

Нефтебурсервис,ОАО

46

17 927

53 260

84 818

73 343

Нефтегазовая компания"Славнефть",ОАО

47

2 557 698

4 537 040

3 841 845

33 477 251

Нефтеразведка,ОАО

48

0

194 091

33 112

15 161

Нефть,ОАО

49

5 406

1 185

38 560

7 540

Нефтьинвест,ОАО

50

40 997

101 706

178 604

58 762


 

 

Решение.

Задание № 1.

Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.

С помощью средств  MS excel построим диаграмму рассеяния. Возьмём данные из таблицы 1 и перенесём их в MS excel. Выделим область Y и X1 в области меню нажмём вставка->Точечная диаграмма. Такую же последовательность действий сделаем с Х4 и Х5. Результаты отразим на рисунках 1,2,3.

 

 

Рисунок1. Диаграмма рассеяния зависимости Y от фактора X1

Связь прямая и сильная (R2=0,752)

 

 

 

Рисунок2. Диаграмма рассеяния зависимости Y от фактора X4

 

Связь прямая и сильная (R2=0,878)

 

 

Рисунок 3. Диаграмма рассеяния зависимости Y от фактора X5

 

Связь прямая и слабая (R2 = 0,428).

 

Задание №2. а) Корреляционный анализ данных.


Прибыль (убыток)  – это  зависимая переменная Y (тыс. руб.).

Независимые, объясняющие  переменные:

X1 – долгосрочные обязательства, руб.;

X4 – основные средства, руб.;

X5  – дебиторская задолженность (краткосрочные), руб.

Количество наблюдений n = 50, количество объясняющих переменных m = 3.

Для проведения корреляционного  анализа используем инструмент Корреляция (надстройка Анализ данных Excel).

В результате будет получена матрица коэффициентов парной корреляции (табл. 2).

 

Таблица 2. Результат корреляционного анализа

 

Анализ показывает, что зависимая переменная, то есть прибыль (убыток), имеет весьма тесную связь с основными средствами (ryx4 = 0,937) и тесную связь с долгосрочными обязательствами (ryx1 = 0,867). Фактор Х5 имеет слабую связь с зависимой переменной и его не рекомендуется включать в модель регрессии.

Затем перейдем к анализу  остальных столбцов матрицы с  целью выявления коллинеарности. Факторы Х1 и Х4 тесно связаны между собой (rx1x5 = 0,953), что свидетельствует о наличии коллинеарности.

Таким образом, на основе анализа  только корреляционной матрицы остаются два фактора – Основные средства и Долгосрочные обязательства (n = 50, k =2).

Одним из условий классической регрессионной модели является предположение  о независимости объясняющих переменных. Мультиколлинеарность приводит к неопределенности значений параметров и к неустойчивости их оценок. Неустойчивость выражается в увеличении статистической неопределенности, в связи с чем конкретные результаты оценки могут сильно различаться.

Для выявления мультиколлинеарности выполняем тест Фаррара–Глоубера по факторам Х1, Х4, Х5.

 

1)Проверка  наличия мультиколлинеарности всего массива переменных

1. Построим матрицу межфакторных корреляций R1 (табл. 3) и найдем ее определитель с помощью функции МОПРЕД.

 

Таблица 3. Матрица R1

   

X1

X4

X5

R1 =

 

Долгосрочные  обязательства

Основные средства

Дебиторская задолженность (краткосрочная)

X1

Долгосрочные  обязательства

1

0,952609806

0,507984957

X4

Основные средства

0,952609806

1

0,565025248

X5

Дебиторская задолженность (краткосрочная)

0,507984957

0,565025248

1


 

2. Вычислим наблюдаемое  значение статистики Фаррара–Глоубера по следующей формуле:

где n = 50 – количество наблюдений;

k = 3 – количество факторов.

Фактическое значение этого  критерия FGнабл сравниваем с табличным значением χ2 при степени свободы и уровне значимости α = 0,05. Табличное значение χ2 можно найти с помощью функции ХИ2ОБР (рис. 1).

 

Рис. 1. Получение табличного значения χ2

Так как FGнабл > FGкрит (131,09 > 7,81), то в массиве объясняющих переменных существует мультиколлинеарность.

 

2)Проверка  наличия мультиколлинеарности каждой переменной с другими переменными

1. Вычислим обратную матрицу.  Для этого воспользуемся функцией  МОБР и комбинацией клавиш  Ctrl+Shift+Enter для расчета по всему массиву данных.

   

X1

X4

X5

   

Долгосрочные  обязательства

Основные средства

Дебиторская задолженность (краткосрочная)

X1

Долгосрочные  обязательства

10,96621798

-10,72198798

0,487520145

X4

Основные средства

-10,72198798

11,95217291

-1,306670865

X5

Дебиторская задолженность (краткосрочная)

0,487520145

-1,306670865

1,49064913


 

2. Вычислим F-критерии , где cjj – диагональные элементы матрицы C:

 

3. Фактические значения F-критериев сравниваем с табличным значением (функция FРАСПОБР) Fтабл = 2,807 при n1 = 3 и n2 = (n – k – 1) = 46 степенях свободы и уровне значимости α = 0,05, где k – количество факторов.

4. Так как F1 > Fтабл и F4 > Fтабл, то независимые переменные Х1 и Х4 мультиколлинеарны.

 

3)Проверка  наличия мультиколлинеарности каждой пары переменных

1. Вычислим частные коэффициенты корреляции по формуле , где cjj – элементы матрицы C:

 

2. Вычислим t-критерии по формуле :

t1,4 = 18,028;

t1,5 = -0,821;

t4,5 = 2,211;

Фактические значения t-критериев сравниваются с табличным значением (функция СТЬЮДРАСПОБР) при степенях свободы (n – k – 1)=46 и уровне значимости α = 0,05: tтабл = 2,013. Так как | t1,4 | > tтабл и r1,4 = 0,936 "1, то между независимыми переменными Х1 и Х4 существует мультиколлинеарность.

Для того, чтобы избавиться от мультиколлинеарности, нужно исключить одну из переменных мультиколлинеарной пары Х4, Х6. Удалить следует переменную Х4, так как у нее больше значение F-критерия. Следовательно, она больше влияет на общую мультиколлинеарность факторов.

Выводы, сделанные ранее только на основе корреляционной матрицы различаются с результатами теста Фаррара–Глоубера, после его выполнения делаем выбор в пользу двух факторов Х1 и Х5.

Получим следующую модель регрессии: Ŷ = 81259,86 + 0,2269Х1 + 0,1394Х5

 

б) Выбор факторных признаков для построения регрессионной модели методом исключения.


Для проведения регрессионного анализа используем инструмент Регрессия (надстройка Анализ данных в Excel).

На первом шаге строится модель регрессии по всем факторам:

Ŷ = - 165474,89  – 0,068Х1  +  0,397Х4  +  0,084Х5

                            (0,05)      (0,06)       (0,03)

 

В скобках указаны значения стандартных ошибок коэффициентов  регрессии.

Фрагмент протокола регрессионного анализа приведен в табл. 4.

 

Таблица 4. Модель регрессии по трем факторам

 

После построения уравнения  регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент  при котором незначим и имеет  наименьший по абсолютной величине коэффициент t при 5%-ном уровне значимости, а именно Х1. Все остальные регрессионные коэффициенты значимы, так как табличное значение критерия Стьюдента равно: tтабл (α = 0,01; df = n – k-1 = 46) = 2,69  и tрасч > tтабл

Таблица 5. Модель регрессии со значимыми факторами

 

Получаем уравнение регрессии, коэффициенты которого значимы не только при 5%-ном уровне значимости, но и при 1%-ном уровне значимости:

Ŷ = - 120917,83  +  0,32Х4  +  0,09Х5

                              (0,02)        (0,03)

Сравнивая результаты   выбора факторных признаков для  построения регрессионной модели:  а) на основе анализа матрицы коэффициентов  парной корреляции с проверкой гипотезы о независимости объясняющих  переменных  на основе теста Фаррара–Глоубера  и б) методом исключения приходим к выводу о необходимости применения теста на выбор «длинной» и «короткой» регрессии.

Этот тест используется для  отбора наиболее существенных объясняющих  переменных. Иногда переход от большего числа исходных показателей анализируемой  системы к меньшему числу наиболее информативных факторов может быть объяснен дублированием информации, из-за сильно взаимосвязанных факторов. Стремление к построению более простой  модели приводит к идее уменьшения размерности модели без потери ее качества. Для этого используют тест проверки «длинной» и «короткой» регрессий.

Алгоритм проверки следующий:

1. Построим по МНК «длинную»  регрессию по всем факторам Х1, Х4, Х5 и найдем для нее сумму квадратов остатков ESSдлин.

2. Построим по МНК «короткую»  регрессию по факторам Х1, Х5 и найдем для нее сумму квадратов остатков ESSкор(2,6) и вычислим F-статистику.

3. Построим по МНК «короткую»  регрессию по факторам Х4, Х5 и найдем для нее сумму квадратов остатков ESSкор(4,6) и вычислим F-статистику.

4. Если Fнабл > Fтабл (α, ν1 = q, ν2 = n – k – 1), то выбираем «длинную» регрессию, в противном случае – «короткую» регрессию.

На основании данных сравним три модели – «длинную» (с факторами X1, X4, X5) и две «короткие» (с факторами X1, X5 и Х4, Х5).

1) Построим «длинную»  регрессию по всем факторам X2, X4, X6 и найдем для нее сумму квадратов остатков ESSдлин , а также рассчитаем Fтабл с помощью функции FРАСПОБР.

 

 

 

 

 

2) Построим «короткую» регрессию по факторам X1, X5 и найдем для нее сумму квадратов остатков ESSкор , а также вычислим Fнабл(1,5) .

3) Построим «короткую» регрессию по факторам X4, X5 и найдем для нее сумму квадратов остатков ESSкор , а также вычислим Fнабл(4,6) .

Информация о работе Кореляционно-регрессионный анализ