Исследование влияния основных социально-экономических показателей на результативный признак
Автор работы: Пользователь скрыл имя, 06 Декабря 2014 в 19:57, контрольная работа
Описание работы
Цель исследования: изучение влияния факторов на успеваемостьшкольников Сузановской средней школы 8-11 классов.
Объект исследования: ученики8-11 классаСузановской средней школы Новосергиевского района Оренбургской области.
Предметом исследования выступает набор количественных и качественных признаков, характеризующих:
y- успеваемость по обществознанию;
x1 - количество школьников в исследуемых классах;
Файлы: 1 файл
эконометрика.docx
— 93.15 Кб (Скачать файл)
Вывод: F наблюдаемое больше чем Fтабличное. Гипотеза Н0 отклоняется принимается Н1. Модель адекватна выборочным данным.
4 Задание. Проверка на значимость отдельных коэффициентов модели множественной регрессии
H0: Вj = 0 (незначимый)
В1: Вj не= 0 (значимый)
tкр= (ά;n-к-1) по таблице Стьюдента, где ά = 0,05
Tкр– находим по таблице Стьюдента. (0,05; 24)
Tкр= 2,06
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,25 |
0,28 |
2,06 |
Незначим |
В1 |
0,01 |
0,84 |
2,06 |
Незначим |
В2 |
-0,0033 |
-0,06 |
2,06 |
Незначим |
В3 |
-0,05 |
-0,36 |
2,06 |
Незначим |
В4 |
-0,13 |
-1,05 |
2,06 |
Незначим |
В5 |
0,07 |
0,49 |
2,06 |
Незначим |
В6 |
0,24 |
1,94 |
2,06 |
Незначим |
В7 |
0,66 |
5,26 |
2,06 |
Значим |
В8 |
0,01 |
0,106 |
2,06 |
Незначим |
5 Задание. Для значимых коэффициентов построим доверительные интервалы
Нижняя граница |
Коэффициент |
Верхняя граница |
0,405 |
В7 |
0,92 |
6 Задание. Оценим
качество построенной модели
с помощью выборочного коэффициента
детерминации
R2=0,89
Выводы:В результате эконометрического моделирования мы выявили, что значимое влияние на успеваемость школьников Сузановской средней школы в 8-11 классах оказывает фактор x7 – успеваемость по истории (по расчетам в excel и по таблице).
Успеваемость по истории Отечества влияет на успеваемость по обществознанию, так как оба предмета являются гуманитарными и часто выбираются учащимися при сдаче ЕГЭ для поступления в учебные заведения. Кроме этого историю и обществознание в Сузановской школе ведет один и тот же педагог.
Поэтому при улучшении успеваемости школьников по истории Отечества на 1 балл, успеваемость школьников по обществознанию увеличится в среднем на 0,66 баллов.
Все остальные факторы оказались незначимыми. Однако R2 = 0, 89 (чем ближе к 1, тем лучше). Это означает, что вариация успеваемости школьников на 89% объясняется вошедшими в модель факторами. И на 11% объясняется вариацией неучтенных моделей факторов.
2 задача. Мультиколлинеарность.
Из условия (постановки) задачи можно заподозрить зависимость между признаками x5 и x7, т.е. успеваемостью по русскому языку и истории, поскольку это две дисциплины гуманитарного блока.
Проверим данное предположение с помощью внешних и формальных признаков.
Внешние признаки:
1) Большинство (все кроме B7) оказались незначимы. В то время как вся модель казалась адекватной выборочным данным;
2) Большинство доверительных интервалов для коэффициентов (все кроме В7) содержат внутри себя точку 0;
3) Стандартные ошибки для коэффициентов В0,В2, В3, В4, В5, В8 превышают значение самих коэффициентов;
4) х2, х3, х4 имеют отрицательные значения. Однако не всегда отрицательные знаки интерпретируются неправильно. В нашем случае отрицательный знак при x4 наоборот верный, он показывает, что ученики, которые занимаются в кружках (секциях) имеют успеваемость по обществознанию ниже, чем ученики, которые не занимаются в кружках, это можно объяснить их занятостью и меньшим количеством времени на выполнение домашнего задания и подготовку к уроку.
Анализируя корреляционную матрицу можно выявить наиболее тесную взаимосвязь Х5 , Х6, и Х7. Ниже представлена корреляционная матрица.
Столбец 1 |
Столбец 2 |
Столбец 3 |
Столбец 4 |
Столбец 5 |
Столбец 6 |
Столбец 7 |
Столбец 8 | |
Столбец 1 |
1 |
|||||||
Столбец 2 |
-0,16762 |
1 |
||||||
Столбец 3 |
0,104839 |
-0,26647 |
1 |
|||||
Столбец 4 |
0,012581 |
-0,13939 |
0,283333 |
1 |
||||
Столбец 5 |
0,051806 |
-0,10561 |
0,223452 |
0,141732 |
1 |
|||
Столбец 6 |
0,239981 |
-0,189 |
0,252349 |
0,192382 |
0,810425 |
1 |
||
Столбец 7 |
0,38811 |
-0,09569 |
0,230599 |
0,131329 |
0,753419 |
0,778709 |
1 |
|
Столбец 8 |
0,050435 |
-0,06574 |
-0,0297 |
-0,13363 |
-0,06399 |
-0,14576 |
-0,10146 |
1 |
Действительно, на основе корреляционной матрицы можно выделить зависимость между х6и х5; х7 и х5; х7 и х6. Выбирали среди признаков, где коэффициент корреляции больше 0,6.
R2х1 = 0,32
R2х2 = 0,13
R2х3 = 0,16
R2х4 = 0,11
R2х5 =0,75
R2х6 =0,74
R2х7 =0,72
R2х8 =0,06
Наиболее близкие показатели к 1 (R2х5 =0,75, R2х6 =0,74, R2х7 =0,72) между этими показателями существует мультиколлинеарность.
Устраним мультиколлинеарность методом пошаговой регрессии с исключением переменных. На первом шаге исключаем из рассмотрения х2 поскольку ему соответствует незначительный коэффициент = 0,06.
Возвращаемся к исходным данным удаляем х2. Снова регрессия, но уже без х2.
Y= 0,19+0,01х1-0,05х3-0,13х4+0,07х5+0,24х6+0,66 х7+0,01х8
Ткр= (0,05; 25) = 2,05
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,19 |
0,65 |
2,05 |
Незначим |
В1 |
0,01 |
0,88 |
2,05 |
Незначим |
В3 |
0,05 |
-0,37 |
2,05 |
Незначим |
В4 |
0,13 |
-1,07 |
2,05 |
Незначим |
В5 |
0,07 |
0,501 |
2,05 |
Незначим |
В6 |
0,24 |
2,01 |
2,05 |
Незначим |
В7 |
0,66 |
5,409 |
2,05 |
Значим |
В8 |
0,01 |
0,11 |
2,05 |
Незначим |
На следующем шаге исключаем х8. Убираем х8.
Y= 0,206+0,014х1-0,05х3-0,13х4+0,07х5+0,24х6+0,66х7
Ткр= (0,05; 26) = 2,05
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,206 |
0,71 |
2,05 |
Незначим |
В1 |
0,014 |
0,92 |
2,05 |
Незначим |
В3 |
-0,05 |
-0,37 |
2,05 |
Незначим |
В4 |
-0,13 |
-1,11 |
2,05 |
Незначим |
В5 |
0,07 |
0,53 |
2,05 |
Незначим |
В6 |
0,24 |
2,06 |
2,05 |
Значим |
В7 |
0,66 |
5,52 |
2,05 |
Значим |
Исключаем х3. Убираем х3.
Y= 0,19 + 0,01х1-0,14 х4 + 0,07 х5 + 0,24 х6 + 0,66 х7
Ткр= (0,05; 27) = 2,05
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,19 |
0,69 |
2,05 |
Незначим |
В1 |
0,01 |
0,92 |
2,05 |
Незначим |
В4 |
-0,14 |
-1,26 |
2,05 |
Незначим |
В5 |
0,07 |
0,52 |
2,05 |
Незначим |
В6 |
0,24 |
2,07 |
2,05 |
Значим |
В7 |
0,66 |
5,604 |
2,05 |
Значим |
Исключаем х5. Убираем х5.
Y= 0,26 + 0,01х1-0,14 х4 + 0,27х6 + 0,69х7
Ткр= (0,05; 28) = 2,04
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,26 |
1,08 |
2,04 |
Незначим |
В1 |
0,01 |
0,78 |
2,04 |
Незначим |
В4 |
-0,14 |
-1,3 |
2,04 |
Незначим |
В6 |
0,27 |
2,86 |
2,04 |
Значим |
В7 |
0,69 |
6,64 |
2,04 |
Значим |
Исключаем х1. Убираем х1.
Y= 0,302-0,14 х4 + 0,26х6 + 0,71х7
Ткр= (0,05; 29) = 2,04
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,302 |
1,26 |
2,04 |
Незначим |
В4 |
-0,14 |
-1,33 |
2,04 |
Незначим |
В6 |
0,26 |
2,81 |
2,04 |
Значим |
В7 |
0,71 |
7,36 |
2,04 |
Значим |
Исключаем х4. Убираем х4.
Y= 0,23 + 0,72х6 + 0,24х7
Ткр= (0,05; 30) = 2,04
Таблица
Коэффициент |
Значение |
Tн |
Tкр |
Выводы |
В0 |
0,23 |
0,98 |
2,04 |
Незначим |
В6 |
0,72 |
7,31 |
2,04 |
Значим |
В7 |
0,24 |
2,61 |
2,04 |
Значим |
Вывод: Мы получили модель со значимыми коэффициентами В6и В7. Таким образом, на успеваемость учащихся Сузановской средней школы по обществознанию оказывают значительное влияние средний бал успеваемости по алгебре и средний бал успеваемости по истории Отечества.
При увеличении успеваемости школьников по алгебре на 1 балл их успеваемость по обществознанию улучшается, а именно, увеличивается в среднем на 0,72 балла, увеличение успеваемости по истории на 1 балл приводит к роту среднего балла по обществознанию на 0,24 балла.
3. Обобщенная линейная модель множественной регрессии. С гетероскедастичными остатками.
На основе предыдущего задания мы выявили, что значимыми являются факторы х6 и х7. Теперь определим, существует ли у этих факторов гетероскедастичные остатки.
Д (Ei) = const - гомоскед.
Д (Ei) = (не равно) const – гетероск.