Лабораторная работа по "Эконометрике"

Автор работы: Пользователь скрыл имя, 28 Апреля 2013 в 17:24, лабораторная работа

Описание работы

Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам. Постройте линейную регрессионную модель цены системного блока компьютера, не содержащую коллинеарных факторов. Оцените параметры модели. Если имеется возможность, постройте несколько моделей и выберите одну из них в качестве лучшей.
Существенно ли влияет на цену системного блока: а) тактовая частота процессора; б) размер оперативной памяти;
в) наличие или отсутствие DVD-накопителя? Дайте количественные соотношения.

Файлы: 1 файл

Лабораторка_Вариант_18.docx

— 1.52 Мб (Скачать файл)

                              Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам.

№ компьютера

Цена системного блока

Тактовая частота  процессора, МГц

Оперативная память, Мбайт

DVD-накопитель

 

Y

X1

X2

X3

1

12 500

2 000

256

Отсутствует

2

13 700

2 800

256

Имеется

3

16 250

2 700

512

Отсутствует

4

13 580

2 800

256

Отсутствует

5

19 840

3 200

512

Имеется

6

16 570

2 400

512

Отсутствует

7

12 560

2 700

128

Отсутствует

8

18 260

3 200

512

Имеется

9

14 590

2 700

256

Отсутствует

10

17 250

2 400

512

Имеется

11

14 890

2 700

256

Отсутствует

12

11 560

1 800

128

Отсутствует

13

15 870

2 700

512

Отсутствует


  1. Постройте линейную регрессионную модель цены системного блока компьютера, не содержащую коллинеарных факторов. Оцените параметры модели. Если имеется возможность, постройте несколько моделей и выберите одну из них в качестве лучшей.
  2. Существенно ли влияет на цену системного блока:

а) тактовая частота процессора;

б) размер оперативной памяти;

в) наличие или отсутствие DVD-накопителя?

Дайте количественные соотношения.

  1. Рассчитайте стоимость системного блока, если тактовая частота процессора составляет 3000 Мгц, оперативная память – 256 Мбайт, а DVD-накопитель: а) имеется; б) отсутствует.

Примечание. Там, где необходимо, уровень значимости a примите равным 0,05.

 

 

 

 

  1. Постройте линейную регрессионную модель цены системного блока компьютера, не содержащую коллинеарных факторов. Оцените параметры модели. Если имеется возможность, постройте несколько моделей и выберите одну из них в качестве лучшей.

Коэффициенты  интеркорреляции (т. е. сила связи между объясняющими переменными) позволяют исключить из модели регрессии дублирующие факторы. Две переменных явно коллинеарны, когда они находятся между собой в линейной зависимости, если коэффициент корреляции > 0,7.

Поскольку одним из условий  нахождения уравнения множественной  регрессии является независимость  действия факторов, коллинеарность факторов нарушает это условие. Если факторы модели коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии.

Предпочтение в эконометрике отдается не фактору, более сильно связанному с результатом, а фактору, который при сильной связи с результатом имеет наименьшую тесноту связи с другими факторами. Т.е. коэффициент корреляции между факторами меньше 0,3 или, в идеале, близок к нулю. В этом условии проявляется специфика множественной регрессии как метода исследования комплексного влияния факторов на результат в условиях их независимости друг от друга.

Для обнаружения мультиколлинеарности факторов можно проанализировать непосредственно корреляционную матрицу факторов. Уже наличие больших по модулю (выше 0,7-0,8) значений коэффициентов парной корреляции свидетельствует о возможных проблемах с качеством получаемых оценок.

Матрица парных корреляций:                                                                                                                            

Для проверки этой гипотезы используется критерий Стьюдента для  статистики:

 

 

Критическое (табличное значение критерия Стьюдента  определяется при выбранном уровне значимости a и числе степеней свободы .

Уровень значимости – это  вероятность, с которой мы не гарантируем  правильности статистических оценок. Соответственно, доверительная вероятность

 

Это вероятность, с которой  мы гарантируем правильность этих оценок.

Оценим с помощью t- критерия Стьюдента статистическую значимость коэффициентов корреляции. Табличное значение t- критерия при 5 % уровне значимости и степени свободы κ= 13-2=11 составляет 2,20.

   Если ttab > 2,20 коэффициент корреляции между факторами а и b статистически значим, т.е. линейная связь признаются значимой;

Т.к. tx1  = 2,87 > 2,20,  коэффициент корреляции между факторами У и X1 статистически значим, т.е. линейная связь признаются значимой;

 

Т.к. tx2  = 6,39  > 2,20,  коэффициент корреляции между факторами У и X2 статистически значим, т.е. линейная связь признаются значимой;

Т.к. tx3  = 2,43  > 2,20,  коэффициент корреляции между факторами У и X2 статистически значим, т.е. линейная связь признаются значимой;

Т.к. tx1x2  = 1,52 < 2,20,  коэффициент корреляции между факторами X1 и X2 статистически незначим, т.е. линейная связь признаются незначимой;

Т.к. tx1x3  = 1,81 < 2,20,  коэффициент корреляции между факторами X1 и X3 статистически незначим, т.е. линейная связь признаются незначимой;

Т.к. tx2x3  = 1,49 < 2,20,  коэффициент корреляции между факторами X2 и X3 статистически незначим, т.е. линейная связь признаются незначимой.

Можно сделать вывод о том, что коллинеарности факторов в рассматриваемом примере нет. Отсутствие влияния между независимыми переменными Х1, Х2 иХ3 позвляет включить их в следующий этап исследования – построение модели регрессии.

 

 

 

 

Построим регрессионные  модели в среде EXEL: АНАЛИЗ ДАННЫХ→РЕГРЕССИЯ:

Модель У-X1

После команды ОК появится следующее окно.

Модель Y- X1: У= 4732,24 + 3,98*X1

Модель У-X2

Модель Y- X2: У= 10330,92 +13,69*X2

Модель У-X3

Модель Y- X3: У= 14263,33 +2999,16*X3

 

Для оценки качества модели регрессии вычисляют коэффициент  детерминации (R- квадрат).

Он показывает долю вариации результативного признака под воздействием изучаемых факторов.

R1= 0,4279. Следовательно, около 42,79 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

R2= 0,7884. Следовательно, около 78,84 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

R3= 0,3489. Следовательно, около 34,89 % вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Вывод: Лучшая модель- модель 2.

 

 

 

 

 

 

Линейная регрессия. Зависимая переменная -   Показатель- 1

               
                 

Оценки коэффициентов  линейной регрессии

               

Переменная

Коэффи 
циент

Среднекв. 
отклонение

t- 
значение

Нижняя 
оценка

Верхняя 
оценка

Эластич 
ность

Бета- 
коэф-т

Дельта- 
коэф-т

Св. член

6125.538

1973.330

3.104

3952.798

8298.278

0.000

0.000

0.000

  Показатель- 2

1.859

0.835

2.227

0.940

2.779

0.321

0.200

0.198

  Показатель- 3

11.388

1.874

6.076

9.325

13.452

0.266

0.738

0.732

  Показатель- 4

380.522

626.655

0.607

-309.458

1070.501

0.010

0.070

0.070

Кpитическое значения t-pаспpеделения пpи 9 степенях свободы (p=85%) = +1.101

               
                 

Таблица остатков

               

номер

Факт

Расчет

Ошибка 
абс.

Ошибка 
относит.

       

1

12500.000

12759.913

-259.913

-2.079

       

2

13700.000

14628.014

-928.014

-6.774

       

3

16250.000

16976.971

-726.971

-4.474

       

4

13580.000

14628.014

-1048.014

-7.717

       

5

19840.000

18287.230

1552.770

7.826

       

6

16570.000

16419.129

150.871

0.911

       

7

12560.000

12603.832

-43.832

-0.349

       

8

18260.000

18287.230

-27.230

-0.149

       

9

14590.000

14061.545

528.455

3.622

       

10

17250.000

16799.651

450.349

2.611

       

11

14890.000

14061.545

828.455

5.564

       

12

11560.000

10930.305

629.695

5.447

       

13

15870.000

16976.971

-1106.971

-6.975

       

 

 
               
                 

Характеристики остатков

               

Характеристика

Значение

             

Среднее значение

-0.027

             

Дисперсия

598647.921

             

Приведенная дисперсия

864713.665

             

Средний модуль остатков

637.042

             

Относительная ошибка

4.192

             

Критерий Дарбина-Уотсона

1.654

             

Коэффициент детерминации

0.997

             

F - значение ( n1 =   3, n2 =   9)

1180.214

             

Критерий адекватности

80.879

             

Критерий точности

67.023

             

Критерий качества

70.487

             

Уравнение значимо с вероятностью 0.95

               
                 
                 

 

Проверку значимости уравнения  регрессии произведем на основе вычисления F- критерия Фишера.

F= 41 (см. дисперсионный анализ).                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      

Табличное значение F- критерия (F крит.) при доверительной вероятности 0, 95 при к1=к=1 и к2= N- к- 1 = 13- 1 -1= 11 составляет 4,84.

Информация о работе Лабораторная работа по "Эконометрике"