Автор работы: Пользователь скрыл имя, 28 Апреля 2013 в 17:24, лабораторная работа
Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам. Постройте линейную регрессионную модель цены системного блока компьютера, не содержащую коллинеарных факторов. Оцените параметры модели. Если имеется возможность, постройте несколько моделей и выберите одну из них в качестве лучшей.
Существенно ли влияет на цену системного блока: а) тактовая частота процессора; б) размер оперативной памяти;
в) наличие или отсутствие DVD-накопителя? Дайте количественные соотношения.
Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам.
№ компьютера |
Цена системного блока |
Тактовая частота процессора, МГц |
Оперативная память, Мбайт |
DVD-накопитель |
Y |
X1 |
X2 |
X3 | |
1 |
12 500 |
2 000 |
256 |
Отсутствует |
2 |
13 700 |
2 800 |
256 |
Имеется |
3 |
16 250 |
2 700 |
512 |
Отсутствует |
4 |
13 580 |
2 800 |
256 |
Отсутствует |
5 |
19 840 |
3 200 |
512 |
Имеется |
6 |
16 570 |
2 400 |
512 |
Отсутствует |
7 |
12 560 |
2 700 |
128 |
Отсутствует |
8 |
18 260 |
3 200 |
512 |
Имеется |
9 |
14 590 |
2 700 |
256 |
Отсутствует |
10 |
17 250 |
2 400 |
512 |
Имеется |
11 |
14 890 |
2 700 |
256 |
Отсутствует |
12 |
11 560 |
1 800 |
128 |
Отсутствует |
13 |
15 870 |
2 700 |
512 |
Отсутствует |
а) тактовая частота процессора;
б) размер оперативной памяти;
в) наличие или отсутствие DVD-накопителя?
Дайте количественные соотношения.
Примечание. Там, где необходимо, уровень значимости a примите равным 0,05.
Коэффициенты интеркорреляции (т. е. сила связи между объясняющими переменными) позволяют исключить из модели регрессии дублирующие факторы. Две переменных явно коллинеарны, когда они находятся между собой в линейной зависимости, если коэффициент корреляции > 0,7.
Поскольку одним из условий нахождения уравнения множественной регрессии является независимость действия факторов, коллинеарность факторов нарушает это условие. Если факторы модели коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии.
Предпочтение в эконометрике отдается не фактору, более сильно связанному с результатом, а фактору, который при сильной связи с результатом имеет наименьшую тесноту связи с другими факторами. Т.е. коэффициент корреляции между факторами меньше 0,3 или, в идеале, близок к нулю. В этом условии проявляется специфика множественной регрессии как метода исследования комплексного влияния факторов на результат в условиях их независимости друг от друга.
Для обнаружения
Матрица парных корреляций:
Для проверки этой гипотезы используется критерий Стьюдента для статистики:
Критическое (табличное значение критерия Стьюдента определяется при выбранном уровне значимости a и числе степеней свободы .
Уровень значимости – это вероятность, с которой мы не гарантируем правильности статистических оценок. Соответственно, доверительная вероятность
Это вероятность, с которой мы гарантируем правильность этих оценок.
Оценим с помощью t- критерия Стьюдента статистическую значимость коэффициентов корреляции. Табличное значение t- критерия при 5 % уровне значимости и степени свободы κ= 13-2=11 составляет 2,20.
Если ttab > 2,20 коэффициент корреляции между факторами а и b статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx1 = 2,87 > 2,20, коэффициент корреляции между факторами У и X1 статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx2 = 6,39 > 2,20, коэффициент корреляции между факторами У и X2 статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx3 = 2,43 > 2,20, коэффициент корреляции между факторами У и X2 статистически значим, т.е. линейная связь признаются значимой;
Т.к. tx1x2 = 1,52 < 2,20, коэффициент корреляции между факторами X1 и X2 статистически незначим, т.е. линейная связь признаются незначимой;
Т.к. tx1x3 = 1,81 < 2,20, коэффициент корреляции между факторами X1 и X3 статистически незначим, т.е. линейная связь признаются незначимой;
Т.к. tx2x3 = 1,49 < 2,20, коэффициент корреляции между факторами X2 и X3 статистически незначим, т.е. линейная связь признаются незначимой.
Можно сделать вывод о том, что коллинеарности факторов в рассматриваемом примере нет. Отсутствие влияния между независимыми переменными Х1, Х2 иХ3 позвляет включить их в следующий этап исследования – построение модели регрессии.
Построим регрессионные модели в среде EXEL: АНАЛИЗ ДАННЫХ→РЕГРЕССИЯ:
Модель У-X1
После команды ОК появится следующее окно.
Модель Y- X1: У= 4732,24 + 3,98*X1
Модель У-X2
Модель Y- X2: У= 10330,92 +13,69*X2
Модель У-X3
Модель Y- X3: У= 14263,33 +2999,16*X3
Для оценки качества модели
регрессии вычисляют
Он показывает долю вариации результативного признака под воздействием изучаемых факторов.
R1= 0,4279. Следовательно, около 42,79 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
R2= 0,7884. Следовательно, около 78,84 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
R3= 0,3489. Следовательно, около 34,89 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Вывод: Лучшая модель- модель 2.
Линейная регрессия. Зависимая переменная - Показатель- 1 |
||||||||
Оценки коэффициентов линейной регрессии |
||||||||
Переменная |
Коэффи |
Среднекв. |
t- |
Нижняя |
Верхняя |
Эластич |
Бета- |
Дельта- |
Св. член |
6125.538 |
1973.330 |
3.104 |
3952.798 |
8298.278 |
0.000 |
0.000 |
0.000 |
Показатель- 2 |
1.859 |
0.835 |
2.227 |
0.940 |
2.779 |
0.321 |
0.200 |
0.198 |
Показатель- 3 |
11.388 |
1.874 |
6.076 |
9.325 |
13.452 |
0.266 |
0.738 |
0.732 |
Показатель- 4 |
380.522 |
626.655 |
0.607 |
-309.458 |
1070.501 |
0.010 |
0.070 |
0.070 |
Кpитическое значения t-pаспpеделения пpи 9 степенях свободы (p=85%) = +1.101 |
||||||||
Таблица остатков |
||||||||
номер |
Факт |
Расчет |
Ошибка |
Ошибка |
||||
1 |
12500.000 |
12759.913 |
-259.913 |
-2.079 |
||||
2 |
13700.000 |
14628.014 |
-928.014 |
-6.774 |
||||
3 |
16250.000 |
16976.971 |
-726.971 |
-4.474 |
||||
4 |
13580.000 |
14628.014 |
-1048.014 |
-7.717 |
||||
5 |
19840.000 |
18287.230 |
1552.770 |
7.826 |
||||
6 |
16570.000 |
16419.129 |
150.871 |
0.911 |
||||
7 |
12560.000 |
12603.832 |
-43.832 |
-0.349 |
||||
8 |
18260.000 |
18287.230 |
-27.230 |
-0.149 |
||||
9 |
14590.000 |
14061.545 |
528.455 |
3.622 |
||||
10 |
17250.000 |
16799.651 |
450.349 |
2.611 |
||||
11 |
14890.000 |
14061.545 |
828.455 |
5.564 |
||||
12 |
11560.000 |
10930.305 |
629.695 |
5.447 |
||||
13 |
15870.000 |
16976.971 |
-1106.971 |
-6.975 |
||||
|
||||||||
Характеристики остатков |
||||||||
Характеристика |
Значение |
|||||||
Среднее значение |
-0.027 |
|||||||
Дисперсия |
598647.921 |
|||||||
Приведенная дисперсия |
864713.665 |
|||||||
Средний модуль остатков |
637.042 |
|||||||
Относительная ошибка |
4.192 |
|||||||
Критерий Дарбина-Уотсона |
1.654 |
|||||||
Коэффициент детерминации |
0.997 |
|||||||
F - значение ( n1 = 3, n2 = 9) |
1180.214 |
|||||||
Критерий адекватности |
80.879 |
|||||||
Критерий точности |
67.023 |
|||||||
Критерий качества |
70.487 |
|||||||
Уравнение значимо с вероятностью 0.95 |
||||||||
Проверку значимости уравнения регрессии произведем на основе вычисления F- критерия Фишера.
F= 41 (см. дисперсионный анализ).
Табличное значение F- критерия (F крит.) при доверительной вероятности 0, 95 при к1=к=1 и к2= N- к- 1 = 13- 1 -1= 11 составляет 4,84.