Автор работы: Пользователь скрыл имя, 03 Марта 2013 в 21:09, контрольная работа
Задание № 1.
Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.
Задание №2. а) Корреляционный анализ данных.
Прибыль (убыток) – это зависимая переменная Y (тыс. руб.).
Независимые, объясняющие переменные:
X1 – долгосрочные обязательства, руб.;
X4 – основные средства, руб.;
X5 – дебиторская задолженность (краткосрочные), руб.
Количество наблюдений n = 50, количество объясняющих переменных m = 3.
На основании данных, приведенных в табл. 1:
1. Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.
2. Осуществите двумя способами выбор факторных признаков для построения регрессионной модели:
а) на основе анализа матрицы коэффициентов парной корреляции, включая проверку гипотезы о независимости объясняющих переменных (тест на выявление мультиколлинеарности Фаррара–Глоубера);
б) с помощью пошагового отбора методом исключения.
3. Постройте уравнение множественной регрессии в линейной форме с выбранными факторами. Дайте экономическую интерпретацию коэффициентов модели регрессии.
4. Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, b- и D-коэффициентов.
5. Рассчитайте параметры линейной парной регрессии для наиболее подходящего фактора Хj.
6. Оцените качество построенной модели с помощью коэффициента детерминации, F-критерия Фишера.
7. Проверьте выполнение условия гомоскедастичности.
8. Используя результаты регрессионного анализа ранжируйте компании по степени эффективности.
9. Осуществите прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора Хj составит 80% от его максимального значения. Представьте на графике фактические данные Y, результаты моделирования, прогнозные оценки и границы доверительного интервала.
10. Составьте уравнения нелинейной регрессии:
а) гиперболической;
б) степенной;
в) показательной.
11. Приведите графики построенных уравнений регрессии.
12. Для нелинейных моделей найдите коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравните модели по этим характеристикам и сделайте вывод о лучшей модели.
Таблица 1. Исходные данные
ОАО по добыче сырой нефти и природного газа; предоставление услуг в этих областях |
№ п/п |
Прибыль (убыток) |
Долгосрочные обязательства |
Основные средства |
Дебиторская задолженность (краткосрочная) |
Y |
Х1 |
Х4 |
Х5 | ||
Аганнефтегазгеология, ОАО, многопрофильная компания |
1 |
1 440 075 |
61 749 |
5 165 712 |
3 490 541 |
Азнакаевский горизонт, ОАО |
2 |
5 146 |
17 532 |
19 595 |
23 014 |
Акмай,ОАО |
3 |
13 612 |
20 268 |
81 072 |
8 678 |
Аксоль, ОАО, производственно-коммерческая фирма |
4 |
964 |
211 |
8 446 |
4 821 |
Акционерная нефтяная компания "Башнефть", ОАО |
5 |
19 513 178 |
52 034 182 |
47 002 385 |
23 780 450 |
АЛРОСА-Газ, ОАО |
6 |
28 973 |
602 229 |
1 545 052 |
204 181 |
Арктическая газовая компания,ОАО |
7 |
-780 599 |
311 268 |
740 437 |
1 456 438 |
Барьеганнефтегаз, ОАО |
8 |
2 598 165 |
464 651 |
11 925 177 |
5 566 412 |
Белкамнефть,ОАО |
9 |
628 091 |
214 411 |
2 580 485 |
4 285 041 |
Белорусское управление по повышению нефтеотдачи пластов и капитальному ремонту скважин, ОАО |
10 |
29 204 |
12 039 |
269 908 |
624 393 |
Битран, ОАО |
11 |
1 945 560 |
9 670 |
229 855 |
2 918 345 |
Богородскнефть, ОАО |
12 |
366 170 |
287 992 |
349 643 |
484 537 |
Братсэкогаз, ОАО |
13 |
-20 493 |
1 105 293 |
934 881 |
9 865 |
Булгарнефть,ОАО |
14 |
381 558 |
27 265 |
697 664 |
196 045 |
Варьеганнефть,ОАО |
15 |
1 225 908 |
431 231 |
2 231 651 |
1 095 263 |
Верхнечонскнефтьгаз, ОАО |
16 |
3 293 989 |
37 315 847 |
23 170 344 |
2 477 424 |
Восточная транснациональная компания,ОАО |
17 |
416 616 |
2 122 138 |
3 509 537 |
48 174 |
Восточно-Сибирская нефтегазова |
18 |
-564 258 |
1 395 080 |
1 290 245 |
286 058 |
Геолого-разведочный |
19 |
221 194 |
13 429 |
607 249 |
72 854 |
Грознефтьгаз,ОАО |
20 |
701 035 |
75 554 |
4 616 250 |
1 304 084 |
Губкинский газоперерабатывающий комплекс,ОАО |
21 |
62 200 |
22 195 |
991 114 |
294 575 |
Дагнефтьгаз,ОАО |
22 |
123 440 |
12 350 |
438 262 |
44 889 |
Елабуганефть,ОАО |
23 |
55 528 |
14 686 |
75 442 |
24 275 |
Иделойл,ОАО |
24 |
422 070 |
52 443 |
1 269 731 |
140 535 |
Избербашнефть,ОАО |
25 |
-468 |
239 255 |
10 870 |
114 444 |
Инвестиционная нефтяная компания,ОАО |
26 |
225 452 |
1 292 |
227 132 |
272 147 |
Инга,ОАО |
27 |
-61 237 |
924 951 |
110 970 |
76 561 |
Каббалкнефть,ОАО |
28 |
-540 |
0 |
21 278 |
25 017 |
Калининграднефть,ОАО |
29 |
40 588 |
1 638 |
139 209 |
18 072 |
Камчатгазпром,ОАО |
30 |
53 182 |
54 758 |
113 113 |
496 994 |
Кировское нефтегазодобывающееуправление, |
31 |
-210 |
8 |
12 685 |
602 |
Когалымнефтепрогресс,ОАО |
32 |
63 058 |
235 731 |
873 886 |
474 612 |
Комнедра,ОАО |
33 |
1 197 196 |
2 232 742 |
2 307 478 |
1 040 387 |
Кондурчанефть,ОАО |
34 |
221 177 |
4 682 |
331 954 |
55 155 |
Корпорация"Югранефть",ОАО |
35 |
1 548 768 |
84 262 |
1 138 707 |
7 613 662 |
Краснодарское опытно-экспериментальное управление по повышению нефтеотдачи пластов и капитальному ремонту скважин,ОАО |
36 |
-33 030 |
106 |
16 705 |
5 038 |
Ленинграсланец,ОАО |
37 |
-34 929 |
103 567 |
393 717 |
61 353 |
Меллянефть,ОАО |
38 |
115 847 |
275 386 |
517 290 |
122 062 |
МНКТ,ОАО |
39 |
35 198 |
20 624 |
484 228 |
168 314 |
Мохтикнефть,ОАО |
40 |
788 567 |
33 879 |
42 613 |
317 153 |
Научно-производственное объяединение" |
41 |
309 053 |
99 670 |
18 776 |
212 882 |
Научно-производственное предприятие"Бурсервис",ОАО |
42 |
8 552 |
257 |
12 381 |
63 550 |
НГДУ"Пензанефть",ОАО |
43 |
173 079 |
6 120 |
176 126 |
147 549 |
Негуснефть,ОАО |
44 |
1 227 017 |
33 757 |
2 063 285 |
171 162 |
Ненецкая нефтяная компания,ОАО |
45 |
701 728 |
381 050 |
59 353 |
237 083 |
Нефтебурсервис,ОАО |
46 |
17 927 |
53 260 |
84 818 |
73 343 |
Нефтегазовая компания" |
47 |
2 557 698 |
4 537 040 |
3 841 845 |
33 477 251 |
Нефтеразведка,ОАО |
48 |
0 |
194 091 |
33 112 |
15 161 |
Нефть,ОАО |
49 |
5 406 |
1 185 |
38 560 |
7 540 |
Нефтьинвест,ОАО |
50 |
40 997 |
101 706 |
178 604 |
58 762 |
Решение.
Задание № 1.
Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.
С помощью средств MS excel построим диаграмму рассеяния. Возьмём данные из таблицы 1 и перенесём их в MS excel. Выделим область Y и X1 в области меню нажмём вставка->Точечная диаграмма. Такую же последовательность действий сделаем с Х4 и Х5. Результаты отразим на рисунках 1,2,3.
Рисунок1. Диаграмма рассеяния зависимости Y от фактора X1
Связь прямая и сильная (R2=0,752)
Рисунок2. Диаграмма рассеяния зависимости Y от фактора X4
Связь прямая и сильная (R2=0,878)
Рисунок 3. Диаграмма рассеяния зависимости Y от фактора X5
Связь прямая и слабая (R2 = 0,428).
Задание №2. а) Корреляционный анализ данных.
Прибыль (убыток) – это зависимая переменная Y (тыс. руб.).
Независимые, объясняющие переменные:
X1 – долгосрочные обязательства, руб.;
X4 – основные средства, руб.;
X5 – дебиторская задолженность (краткосрочные), руб.
Количество наблюдений n = 50, количество объясняющих переменных m = 3.
Для проведения корреляционного анализа используем инструмент Корреляция (надстройка Анализ данных Excel).
В результате будет получена матрица коэффициентов парной корреляции (табл. 2).
Таблица 2. Результат корреляционного анализа
Анализ показывает, что зависимая переменная, то есть прибыль (убыток), имеет весьма тесную связь с основными средствами (ryx4 = 0,937) и тесную связь с долгосрочными обязательствами (ryx1 = 0,867). Фактор Х5 имеет слабую связь с зависимой переменной и его не рекомендуется включать в модель регрессии.
Затем перейдем к анализу
остальных столбцов матрицы с
целью выявления
Таким образом, на основе анализа только корреляционной матрицы остаются два фактора – Основные средства и Долгосрочные обязательства (n = 50, k =2).
Одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Мультиколлинеарность приводит к неопределенности значений параметров и к неустойчивости их оценок. Неустойчивость выражается в увеличении статистической неопределенности, в связи с чем конкретные результаты оценки могут сильно различаться.
Для выявления мультиколлинеарности выполняем тест Фаррара–Глоубера по факторам Х1, Х4, Х5.
1)Проверка наличия мультиколлинеарности всего массива переменных
1. Построим матрицу межфакторных корреляций R1 (табл. 3) и найдем ее определитель с помощью функции МОПРЕД.
Таблица 3. Матрица R1
X1 |
X4 |
X5 | ||
R1 = |
Долгосрочные обязательства |
Основные средства |
Дебиторская задолженность (краткосрочная) | |
X1 |
Долгосрочные обязательства |
1 |
0,952609806 |
0,507984957 |
X4 |
Основные средства |
0,952609806 |
1 |
0,565025248 |
X5 |
Дебиторская задолженность (краткосрочная) |
0,507984957 |
0,565025248 |
1 |
2. Вычислим наблюдаемое
значение статистики Фаррара–
где n = 50 – количество наблюдений;
k = 3 – количество факторов.
Фактическое значение этого критерия FGнабл сравниваем с табличным значением χ2 при степени свободы и уровне значимости α = 0,05. Табличное значение χ2 можно найти с помощью функции ХИ2ОБР (рис. 1).
Рис. 1. Получение табличного значения χ2
Так как FGнабл > FGкрит (131,09 > 7,81), то в массиве объясняющих переменных существует мультиколлинеарность.
2)Проверка наличия мультиколлинеарности каждой переменной с другими переменными
1. Вычислим обратную матрицу.
Для этого воспользуемся
X1 |
X4 |
X5 | ||
Долгосрочные обязательства |
Основные средства |
Дебиторская задолженность (краткосрочная) | ||
Долгосрочные обязательства |
10,96621798 |
-10,72198798 |
0,487520145 | |
X4 |
Основные средства |
-10,72198798 |
11,95217291 |
-1,306670865 |
X5 |
Дебиторская задолженность (краткосрочная) |
0,487520145 |
-1,306670865 |
1,49064913 |
2. Вычислим F-критерии , где cjj – диагональные элементы матрицы C:
3. Фактические значения F-критериев сравниваем с табличным значением (функция FРАСПОБР) Fтабл = 2,807 при n1 = 3 и n2 = (n – k – 1) = 46 степенях свободы и уровне значимости α = 0,05, где k – количество факторов.
4. Так как F1 > Fтабл и F4 > Fтабл, то независимые переменные Х1 и Х4 мультиколлинеарны.
3)Проверка наличия мультиколлинеарности каждой пары переменных
1. Вычислим частные коэффициенты корреляции по формуле , где cjj – элементы матрицы C:
2. Вычислим t-критерии по формуле :
t1,4 = 18,028;
t1,5 = -0,821;
t4,5 = 2,211;
Фактические значения t-критериев сравниваются с табличным значением (функция СТЬЮДРАСПОБР) при степенях свободы (n – k – 1)=46 и уровне значимости α = 0,05: tтабл = 2,013. Так как | t1,4 | > tтабл и r1,4 = 0,936 "1, то между независимыми переменными Х1 и Х4 существует мультиколлинеарность.
Для того, чтобы избавиться от мультиколлинеарности, нужно исключить одну из переменных мультиколлинеарной пары Х4, Х6. Удалить следует переменную Х4, так как у нее больше значение F-критерия. Следовательно, она больше влияет на общую мультиколлинеарность факторов.
Выводы, сделанные ранее только на основе корреляционной матрицы различаются с результатами теста Фаррара–Глоубера, после его выполнения делаем выбор в пользу двух факторов Х1 и Х5.
Получим следующую модель регрессии: Ŷ = 81259,86 + 0,2269Х1 + 0,1394Х5
б) Выбор факторных признаков для построения регрессионной модели методом исключения.
Для проведения регрессионного анализа используем инструмент Регрессия (надстройка Анализ данных в Excel).
На первом шаге строится модель регрессии по всем факторам:
Ŷ = - 165474,89 – 0,068Х1 + 0,397Х4 + 0,084Х5
(0,05) (0,06) (0,03)
В скобках указаны значения стандартных ошибок коэффициентов регрессии.
Фрагмент протокола
Таблица 4. Модель регрессии по трем факторам
После построения уравнения регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьший по абсолютной величине коэффициент t при 5%-ном уровне значимости, а именно Х1. Все остальные регрессионные коэффициенты значимы, так как табличное значение критерия Стьюдента равно: tтабл (α = 0,01; df = n – k-1 = 46) = 2,69 и tрасч > tтабл
Таблица 5. Модель регрессии со значимыми факторами
Получаем уравнение регрессии, коэффициенты которого значимы не только при 5%-ном уровне значимости, но и при 1%-ном уровне значимости:
Ŷ = - 120917,83 + 0,32Х4 + 0,09Х5
(0,02) (0,03)
Сравнивая результаты выбора факторных признаков для построения регрессионной модели: а) на основе анализа матрицы коэффициентов парной корреляции с проверкой гипотезы о независимости объясняющих переменных на основе теста Фаррара–Глоубера и б) методом исключения приходим к выводу о необходимости применения теста на выбор «длинной» и «короткой» регрессии.
Этот тест используется для отбора наиболее существенных объясняющих переменных. Иногда переход от большего числа исходных показателей анализируемой системы к меньшему числу наиболее информативных факторов может быть объяснен дублированием информации, из-за сильно взаимосвязанных факторов. Стремление к построению более простой модели приводит к идее уменьшения размерности модели без потери ее качества. Для этого используют тест проверки «длинной» и «короткой» регрессий.
Алгоритм проверки следующий:
1. Построим по МНК «длинную» регрессию по всем факторам Х1, Х4, Х5 и найдем для нее сумму квадратов остатков ESSдлин.
2. Построим по МНК «короткую» регрессию по факторам Х1, Х5 и найдем для нее сумму квадратов остатков ESSкор(2,6) и вычислим F-статистику.
3. Построим по МНК «короткую» регрессию по факторам Х4, Х5 и найдем для нее сумму квадратов остатков ESSкор(4,6) и вычислим F-статистику.
4. Если Fнабл > Fтабл (α, ν1 = q, ν2 = n – k – 1), то выбираем «длинную» регрессию, в противном случае – «короткую» регрессию.
На основании данных сравним три модели – «длинную» (с факторами X1, X4, X5) и две «короткие» (с факторами X1, X5 и Х4, Х5).
1) Построим «длинную» регрессию по всем факторам X2, X4, X6 и найдем для нее сумму квадратов остатков ESSдлин , а также рассчитаем Fтабл с помощью функции FРАСПОБР.
2) Построим «короткую» регрессию по факторам X1, X5 и найдем для нее сумму квадратов остатков ESSкор , а также вычислим Fнабл(1,5) .
3) Построим «короткую» регрессию по факторам X4, X5 и найдем для нее сумму квадратов остатков ESSкор , а также вычислим Fнабл(4,6) .