Автор работы: Пользователь скрыл имя, 22 Февраля 2014 в 15:11, контрольная работа
Задание:
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов x1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x2 (%)
(p1 = 6, p2 = 8).
Требуется:
1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации R_(yx_1 x_2)^2.
5. С помощью t-критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.
6. С помощью частных F -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 .
7. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
8. Проверить вычисления в MS Excel.
Министерство образования и науки РФ
Хакасский технический институт –
филиал федерального
государственного автономного
«Сибирский федеральный университет»
КОНТРОЛЬНАЯ РАБОТА ПО ЭКОНОМЕТРИКЕ
Выполнил: студент
заочного факультета
специальности
экономика (3,5)
Букатова П. А.
Проверил: кандидат
экономических наук, доцент
Ивановская Т.И.
Абакан – 2013
Задание
По 20 предприятиям региона
изучается зависимость
(p1 = 6, p2 = 8).
Номер предприятия |
y |
x1 |
x2 |
Номер предприятия |
y |
x1 |
x2 |
1 |
7,0 |
4,2 |
11,0 |
11 |
9,0 |
6,8 |
21,0 |
2 |
7,0 |
3,7 |
13,0 |
12 |
11,0 |
6,4 |
22,0 |
3 |
7,0 |
3,9 |
15,0 |
13 |
9,0 |
6,9 |
22,0 |
4 |
7,0 |
4,0 |
17,0 |
14 |
11,0 |
7,2 |
25,0 |
5 |
7,0 |
4,4 |
18,0 |
15 |
12,0 |
7,2 |
28,0 |
6 |
7,0 |
4,8 |
19,0 |
16 |
12,0 |
8,2 |
29,0 |
7 |
8,0 |
5,3 |
19,0 |
17 |
12,0 |
8,1 |
30,0 |
8 |
8,0 |
5,4 |
20,0 |
18 |
12,0 |
8,6 |
31,0 |
9 |
8,0 |
5 |
20,0 |
19 |
14,0 |
9,6 |
32,0 |
10 |
10,0 |
6,8 |
21,0 |
20 |
14,0 |
9,8 |
36,0 |
Требуется:
1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
5. С помощью t-критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.
6. С помощью частных F -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 .
7. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
8. Проверить вычисления в MS Excel.
Решение
Для удобства проведения расчетов занесу результаты промежуточных расчетов в таблицу:
Таблица 1
№ |
y |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
7,0 |
4,2 |
11,0 |
29,4 |
77 |
46,2 |
17,64 |
121 |
49 |
2 |
7,0 |
3,7 |
13,0 |
25,9 |
91 |
48,1 |
13,69 |
169 |
49 |
3 |
7,0 |
3,9 |
15,0 |
27,3 |
105 |
58,5 |
15,21 |
225 |
49 |
4 |
7,0 |
4,0 |
17,0 |
28 |
119 |
68 |
16 |
289 |
49 |
5 |
7,0 |
4,4 |
18,0 |
30,8 |
126 |
79,2 |
19,36 |
324 |
49 |
6 |
7,0 |
4,8 |
19,0 |
33,6 |
133 |
91,2 |
23,04 |
361 |
49 |
7 |
8,0 |
5,3 |
19,0 |
42,4 |
152 |
100,7 |
28,09 |
361 |
64 |
8 |
8,0 |
5,4 |
20,0 |
43,2 |
160 |
108 |
29,16 |
400 |
64 |
9 |
8,0 |
5 |
20,0 |
40 |
160 |
100 |
25 |
400 |
64 |
10 |
10,0 |
6,8 |
21,0 |
68 |
210 |
142,8 |
46,24 |
441 |
100 |
11 |
9,0 |
6,8 |
21,0 |
61,2 |
189 |
142,8 |
46,24 |
441 |
81 |
12 |
11,0 |
6,4 |
22,0 |
70,4 |
242 |
140,8 |
40,96 |
484 |
121 |
13 |
9,0 |
6,9 |
22,0 |
62,1 |
198 |
151,8 |
47,61 |
484 |
81 |
14 |
11,0 |
7,2 |
25,0 |
79,2 |
275 |
180 |
51,84 |
625 |
121 |
15 |
12,0 |
7,2 |
28,0 |
86,4 |
336 |
201,6 |
51,84 |
784 |
144 |
16 |
12,0 |
8,2 |
29,0 |
98,4 |
348 |
237,8 |
67,24 |
841 |
144 |
17 |
12,0 |
8,1 |
30,0 |
97,2 |
360 |
243 |
65,61 |
900 |
144 |
18 |
12,0 |
8,6 |
31,0 |
103,2 |
372 |
266,6 |
73,96 |
961 |
144 |
19 |
14,0 |
9,6 |
32,0 |
134,4 |
448 |
307,2 |
92,16 |
1024 |
196 |
20 |
14,0 |
9,8 |
36,0 |
137,2 |
504 |
352,8 |
96,04 |
1296 |
196 |
Сумма |
192 |
126,3 |
449 |
1298,3 |
4605 |
3067,1 |
866,93 |
10931 |
1958 |
Ср. знач. |
9,6 |
6,315 |
22,45 |
64,915 |
230,25 |
153,355 |
43,3465 |
546,55 |
97,9 |
Найду средние квадратические отклонения признаков:
1. Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить систему линейных уравнений относительно неизвестных параметров либо воспользоваться готовыми формулами.
Рассчитаю сначала парные коэффициенты корреляции:
По готовым формулам нахожу коэффициенты чистой регрессии и параметр a:
Таким образом, получилось следующее уравнение множественно регрессии:
Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на
После нахождения уравнения регрессии составим новую расчетную таблицу (табл. 2) для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации.
Таблица 2
№ |
|||||||
1 |
7,0 |
4,2 |
11,0 |
6,52 |
0,479 |
0,23 |
6,84 |
2 |
7,0 |
3,7 |
13,0 |
6,30 |
0,698 |
0,49 |
9,98 |
3 |
7,0 |
3,9 |
15,0 |
6,69 |
0,308 |
0,09 |
4,40 |
4 |
7,0 |
4,0 |
17,0 |
7,00 |
0,005 |
0,00 |
0,07 |
5 |
7,0 |
4,4 |
18,0 |
7,45 |
-0,451 |
0,20 |
6,45 |
6 |
7,0 |
4,8 |
19,0 |
7,91 |
-0,908 |
0,82 |
12,97 |
7 |
8,0 |
5,3 |
19,0 |
8,34 |
-0,343 |
0,12 |
4,29 |
8 |
8,0 |
5,4 |
20,0 |
8,54 |
-0,538 |
0,29 |
6,73 |
9 |
8,0 |
5 |
20,0 |
8,19 |
-0,190 |
0,04 |
2,38 |
10 |
10,0 |
6,8 |
21,0 |
9,87 |
0,134 |
0,02 |
1,34 |
11 |
9,0 |
6,8 |
21,0 |
9,87 |
-0,866 |
0,75 |
9,62 |
12 |
11,0 |
6,4 |
22,0 |
9,63 |
1,375 |
1,89 |
12,50 |
13 |
9,0 |
6,9 |
22,0 |
10,06 |
-1,061 |
1,13 |
11,79 |
14 |
11,0 |
7,2 |
25,0 |
10,65 |
0,354 |
0,13 |
3,22 |
15 |
12,0 |
7,2 |
28,0 |
10,97 |
1,030 |
1,06 |
8,58 |
16 |
12,0 |
8,2 |
29,0 |
11,95 |
0,051 |
0,00 |
0,42 |
17 |
12,0 |
8,1 |
30,0 |
11,97 |
0,030 |
0,00 |
0,25 |
18 |
12,0 |
8,6 |
31,0 |
12,51 |
-0,514 |
0,26 |
4,28 |
19 |
14,0 |
9,6 |
32,0 |
13,49 |
0,507 |
0,26 |
3,62 |
20 |
14,0 |
9,8 |
36,0 |
14,10 |
-0,099 |
0,01 |
0,71 |
Сумма |
192 |
126,3 |
449 |
192,00 |
0,001 |
7,79 |
110,43 |
Ср. знач. |
9,6 |
6,315 |
22,45 |
9,60 |
- |
0,39 |
5,52 |
Остаточная дисперсия:
Средняя ошибка аппроксимации:
Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
Коэффициенты стандартизованного уравнения регрессии находятся по формуле:
Соответственно уравнение
будет выглядеть следующим
Так как стандартизованные
коэффициенты регрессии можно сравнивать
между собой, то можно сказать, что
ввод в действие новых основных фондов
оказывает большее влияние на
выработку продукции, чем удельный
вес рабочих высокой
Сравнивать влияние факторов
на результат можно также при
помощи средних коэффициентов
Рассчитываю:
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,57% или 0,25% соответственно. Таким образом, подтверждается большее влияние на результат y фактора , чем фактора .
2. Коэффициенты парной корреляции мы уже нашли:
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения. Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии. При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
Коэффициент множественной корреляции определить через матрицы
парных коэффициентов корреляции:
где
– определитель матрицы межфакторной корреляции.
Нахожу:
Коэффициент множественной корреляции:
Аналогичный результат получим при использовании формул:
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом.
3. Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 93,1% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 90%) детерминированность результата y в модели факторами и .
4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F -критерий Фишера:
В моем случае фактическое значение F -критерия Фишера:
Получил, что т.е. вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5. Оценю статистическую значимость параметров чистой регрессии с помощью t-критерия Стьюдента. Рассчитаем стандартные ошибки коэффициентов регрессии по формулам:
Фактические значения t -критерия Стьюдента:
Табличное значение критерия при уровне значимости и числе степеней свободы k =17 составит
Таким образом, признается статистическая значимость параметра т.к. и случайная природа формирования параметра т.к.
Доверительные интервалы для параметров чистой регрессии:
и
6. С помощью частных F-критериев Фишера оценю целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:
Найду и :
Имею:
Получил, что Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного F-критерия для будет иным. т.е. вероятность его случайного формирования меньше принятого стандарта = 0,05 (5%). Следовательно, значение частного F-критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .