Автор работы: Пользователь скрыл имя, 28 Апреля 2013 в 17:24, лабораторная работа
Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам. Постройте линейную регрессионную модель цены системного блока компьютера, не содержащую коллинеарных факторов. Оцените параметры модели. Если имеется возможность, постройте несколько моделей и выберите одну из них в качестве лучшей.
Существенно ли влияет на цену системного блока: а) тактовая частота процессора; б) размер оперативной памяти;
в) наличие или отсутствие DVD-накопителя? Дайте количественные соотношения.
Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам.
| № компьютера | Цена системного блока | Тактовая частота процессора, МГц | Оперативная память, Мбайт | DVD-накопитель | 
| Y | X1 | X2 | X3 | |
| 1 | 12 500 | 2 000 | 256 | Отсутствует | 
| 2 | 13 700 | 2 800 | 256 | Имеется | 
| 3 | 16 250 | 2 700 | 512 | Отсутствует | 
| 4 | 13 580 | 2 800 | 256 | Отсутствует | 
| 5 | 19 840 | 3 200 | 512 | Имеется | 
| 6 | 16 570 | 2 400 | 512 | Отсутствует | 
| 7 | 12 560 | 2 700 | 128 | Отсутствует | 
| 8 | 18 260 | 3 200 | 512 | Имеется | 
| 9 | 14 590 | 2 700 | 256 | Отсутствует | 
| 10 | 17 250 | 2 400 | 512 | Имеется | 
| 11 | 14 890 | 2 700 | 256 | Отсутствует | 
| 12 | 11 560 | 1 800 | 128 | Отсутствует | 
| 13 | 15 870 | 2 700 | 512 | Отсутствует | 
а) тактовая частота процессора;
б) размер оперативной памяти;
в) наличие или отсутствие DVD-накопителя?
Дайте количественные соотношения.
Примечание. Там, где необходимо, уровень значимости a примите равным 0,05.
Коэффициенты интеркорреляции (т. е. сила связи между объясняющими переменными) позволяют исключить из модели регрессии дублирующие факторы. Две переменных явно коллинеарны, когда они находятся между собой в линейной зависимости, если коэффициент корреляции > 0,7.
Поскольку одним из условий нахождения уравнения множественной регрессии является независимость действия факторов, коллинеарность факторов нарушает это условие. Если факторы модели коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии.
Предпочтение в эконометрике отдается не фактору, более сильно связанному с результатом, а фактору, который при сильной связи с результатом имеет наименьшую тесноту связи с другими факторами. Т.е. коэффициент корреляции между факторами меньше 0,3 или, в идеале, близок к нулю. В этом условии проявляется специфика множественной регрессии как метода исследования комплексного влияния факторов на результат в условиях их независимости друг от друга.
Для обнаружения 
Матрица парных корреляций:                               
Для проверки этой гипотезы используется критерий Стьюдента для статистики:
Критическое (табличное значение критерия Стьюдента определяется при выбранном уровне значимости a и числе степеней свободы .
Уровень значимости – это вероятность, с которой мы не гарантируем правильности статистических оценок. Соответственно, доверительная вероятность
Это вероятность, с которой мы гарантируем правильность этих оценок.
Оценим с помощью t- критерия Стьюдента статистическую значимость коэффициентов корреляции. Табличное значение t- критерия при 5 % уровне значимости и степени свободы κ= 13-2=11 составляет 2,20.
Если ttab > 2,20 коэффициент корреляции между факторами а и b статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx1 = 2,87 > 2,20, коэффициент корреляции между факторами У и X1 статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx2 = 6,39 > 2,20, коэффициент корреляции между факторами У и X2 статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx3 = 2,43 > 2,20, коэффициент корреляции между факторами У и X2 статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx1x2 = 1,52 < 2,20, коэффициент корреляции между факторами X1 и X2 статистически незначим, т.е. линейная связь признаются незначимой;
Т.к. tx1x3 = 1,81 < 2,20, коэффициент корреляции между факторами X1 и X3 статистически незначим, т.е. линейная связь признаются незначимой;
Т.к. tx2x3 = 1,49 < 2,20, коэффициент корреляции между факторами X2 и X3 статистически незначим, т.е. линейная связь признаются незначимой.
Можно сделать вывод о том, что коллинеарности факторов в рассматриваемом примере нет. Отсутствие влияния между независимыми переменными Х1, Х2 иХ3 позвляет включить их в следующий этап исследования – построение модели регрессии.
Построим регрессионные модели в среде EXEL: АНАЛИЗ ДАННЫХ→РЕГРЕССИЯ:
Модель У-X1
После команды ОК появится следующее окно.
Модель Y- X1: У= 4732,24 + 3,98*X1
Модель У-X2
Модель Y- X2: У= 10330,92 +13,69*X2
Модель У-X3
Модель Y- X3: У= 14263,33 +2999,16*X3
Для оценки качества модели 
регрессии вычисляют 
Он показывает долю вариации результативного признака под воздействием изучаемых факторов.
R1= 0,4279. Следовательно, около 42,79 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
R2= 0,7884. Следовательно, около 78,84 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
R3= 0,3489. Следовательно, около 34,89 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Вывод: Лучшая модель- модель 2.
| Линейная регрессия. Зависимая переменная - Показатель- 1 | ||||||||
| Оценки коэффициентов линейной регрессии | ||||||||
| Переменная | Коэффи  | Среднекв.  | t-  | Нижняя  | Верхняя  | Эластич  | Бета-  | Дельта-  | 
| Св. член | 6125.538 | 1973.330 | 3.104 | 3952.798 | 8298.278 | 0.000 | 0.000 | 0.000 | 
| Показатель- 2 | 1.859 | 0.835 | 2.227 | 0.940 | 2.779 | 0.321 | 0.200 | 0.198 | 
| Показатель- 3 | 11.388 | 1.874 | 6.076 | 9.325 | 13.452 | 0.266 | 0.738 | 0.732 | 
| Показатель- 4 | 380.522 | 626.655 | 0.607 | -309.458 | 1070.501 | 0.010 | 0.070 | 0.070 | 
| Кpитическое значения t-pаспpеделения пpи 9 степенях свободы (p=85%) = +1.101 | ||||||||
| Таблица остатков | ||||||||
| номер | Факт | Расчет | Ошибка  | Ошибка  | ||||
| 1 | 12500.000 | 12759.913 | -259.913 | -2.079 | ||||
| 2 | 13700.000 | 14628.014 | -928.014 | -6.774 | ||||
| 3 | 16250.000 | 16976.971 | -726.971 | -4.474 | ||||
| 4 | 13580.000 | 14628.014 | -1048.014 | -7.717 | ||||
| 5 | 19840.000 | 18287.230 | 1552.770 | 7.826 | ||||
| 6 | 16570.000 | 16419.129 | 150.871 | 0.911 | ||||
| 7 | 12560.000 | 12603.832 | -43.832 | -0.349 | ||||
| 8 | 18260.000 | 18287.230 | -27.230 | -0.149 | ||||
| 9 | 14590.000 | 14061.545 | 528.455 | 3.622 | ||||
| 10 | 17250.000 | 16799.651 | 450.349 | 2.611 | ||||
| 11 | 14890.000 | 14061.545 | 828.455 | 5.564 | ||||
| 12 | 11560.000 | 10930.305 | 629.695 | 5.447 | ||||
| 13 | 15870.000 | 16976.971 | -1106.971 | -6.975 | ||||
| 
 | ||||||||
| Характеристики остатков | ||||||||
| Характеристика | Значение | |||||||
| Среднее значение | -0.027 | |||||||
| Дисперсия | 598647.921 | |||||||
| Приведенная дисперсия | 864713.665 | |||||||
| Средний модуль остатков | 637.042 | |||||||
| Относительная ошибка | 4.192 | |||||||
| Критерий Дарбина-Уотсона | 1.654 | |||||||
| Коэффициент детерминации | 0.997 | |||||||
| F - значение ( n1 = 3, n2 = 9) | 1180.214 | |||||||
| Критерий адекватности | 80.879 | |||||||
| Критерий точности | 67.023 | |||||||
| Критерий качества | 70.487 | |||||||
| Уравнение значимо с вероятностью 0.95 | ||||||||
Проверку значимости уравнения регрессии произведем на основе вычисления F- критерия Фишера.
F= 41 (см. дисперсионный анализ).                      
Табличное значение F- критерия (F крит.) при доверительной вероятности 0, 95 при к1=к=1 и к2= N- к- 1 = 13- 1 -1= 11 составляет 4,84.