Исследование влияния основных социально-экономических показателей на результативный признак
Автор работы: Пользователь скрыл имя, 06 Декабря 2014 в 19:57, контрольная работа
Описание работы
Цель исследования: изучение влияния факторов на успеваемостьшкольников Сузановской средней школы 8-11 классов. Объект исследования: ученики8-11 классаСузановской средней школы Новосергиевского района Оренбургской области. Предметом исследования выступает набор количественных и качественных признаков, характеризующих: y- успеваемость по обществознанию; x1 - количество школьников в исследуемых классах;
Вывод: F наблюдаемое больше чем Fтабличное.
Гипотеза Н0 отклоняется
принимается Н1. Модель адекватна
выборочным данным.
4 Задание. Проверка
на значимость отдельных коэффициентов
модели множественной регрессии
H0: Вj = 0 (незначимый)
В1: Вj не= 0 (значимый)
tкр= (ά;n-к-1) по
таблице Стьюдента, где ά = 0,05
Tкр– находим
по таблице Стьюдента. (0,05; 24)
Tкр= 2,06
Таблица
Коэффициент
Значение
Tн
Tкр
Выводы
В0
0,25
0,28
2,06
Незначим
В1
0,01
0,84
2,06
Незначим
В2
-0,0033
-0,06
2,06
Незначим
В3
-0,05
-0,36
2,06
Незначим
В4
-0,13
-1,05
2,06
Незначим
В5
0,07
0,49
2,06
Незначим
В6
0,24
1,94
2,06
Незначим
В7
0,66
5,26
2,06
Значим
В8
0,01
0,106
2,06
Незначим
5 Задание. Для значимых
коэффициентов построим доверительные
интервалы
Нижняя граница
Коэффициент
Верхняя граница
0,405
В7
0,92
6 Задание. Оценим
качество построенной модели
с помощью выборочного коэффициента
детерминации
R2=0,89
Выводы:В результате эконометрического
моделирования мы выявили, что значимое
влияние на успеваемость школьников Сузановской
средней школы в 8-11 классах оказывает
фактор x7 – успеваемость
по истории (по расчетам в excel и по таблице).
Успеваемость по истории Отечества
влияет на успеваемость по обществознанию,
так как оба предмета являются гуманитарными
и часто выбираются учащимися при сдаче
ЕГЭ для поступления в учебные заведения.
Кроме этого историю и обществознание
в Сузановской школе ведет один и тот же
педагог.
Поэтому при улучшении успеваемости
школьников по истории Отечества на 1 балл,
успеваемость школьников по обществознанию
увеличится в среднем на 0,66 баллов.
Все остальные факторы оказались
незначимыми. Однако R2 = 0, 89 (чем
ближе к 1, тем лучше). Это означает, что
вариация успеваемости школьников на
89% объясняется вошедшими в модель факторами.
И на 11% объясняется вариацией неучтенных
моделей факторов.
2 задача. Мультиколлинеарность.
Из условия (постановки) задачи
можно заподозрить зависимость между
признаками x5 и x7, т.е. успеваемостью по
русскому языку и истории, поскольку это
две дисциплины гуманитарного блока.
Проверим данное предположение
с помощью внешних и формальных признаков.
Внешние признаки:
1) Большинство (все кроме
B7) оказались
незначимы. В то время как вся модель казалась
адекватной выборочным данным;
2) Большинство доверительных
интервалов для коэффициентов
(все кроме В7) содержат
внутри себя точку 0;
3) Стандартные ошибки
для коэффициентов В0,В2, В3, В4, В5, В8
превышают значение самих коэффициентов;
4) х2, х3, х4 имеют отрицательные
значения. Однако не всегда отрицательные
знаки интерпретируются неправильно.
В нашем случае отрицательный знак при
x4 наоборот
верный, он показывает, что ученики, которые
занимаются в кружках (секциях) имеют успеваемость
по обществознанию ниже, чем ученики, которые
не занимаются в кружках, это можно объяснить
их занятостью и меньшим количеством времени
на выполнение домашнего задания и подготовку
к уроку.
Анализируя корреляционную
матрицу можно выявить наиболее тесную
взаимосвязь Х5 , Х6, и Х7. Ниже представлена
корреляционная матрица.
Столбец 1
Столбец 2
Столбец 3
Столбец 4
Столбец 5
Столбец 6
Столбец 7
Столбец 8
Столбец 1
1
Столбец 2
-0,16762
1
Столбец 3
0,104839
-0,26647
1
Столбец 4
0,012581
-0,13939
0,283333
1
Столбец 5
0,051806
-0,10561
0,223452
0,141732
1
Столбец 6
0,239981
-0,189
0,252349
0,192382
0,810425
1
Столбец 7
0,38811
-0,09569
0,230599
0,131329
0,753419
0,778709
1
Столбец 8
0,050435
-0,06574
-0,0297
-0,13363
-0,06399
-0,14576
-0,10146
1
Действительно, на основе корреляционной
матрицы можно выделить зависимость между
х6и х5; х7 и х5; х7 и х6. Выбирали
среди признаков, где коэффициент корреляции
больше 0,6.
R2х1 = 0,32
R2х2 = 0,13
R2х3 = 0,16
R2х4 = 0,11
R2х5 =0,75
R2х6 =0,74
R2х7 =0,72
R2х8 =0,06
Наиболее близкие показатели
к 1 (R2х5 =0,75, R2х6 =0,74, R2х7 =0,72) между
этими показателями существует мультиколлинеарность.
Устраним мультиколлинеарность
методом пошаговой регрессии с исключением
переменных. На первом шаге исключаем
из рассмотрения х2 поскольку
ему соответствует незначительный коэффициент
= 0,06.
Возвращаемся к исходным данным
удаляем х2. Снова регрессия,
но уже без х2.
Вывод: Мы получили модель со
значимыми коэффициентами В6и В7. Таким образом,
на успеваемость учащихся Сузановской
средней школы по обществознанию оказывают
значительное влияние средний бал успеваемости
по алгебре и средний бал успеваемости
по истории Отечества.
При увеличении успеваемости
школьников по алгебре на 1 балл их успеваемость
по обществознанию улучшается, а именно,
увеличивается в среднем на 0,72 балла,
увеличение успеваемости по истории на
1 балл приводит к роту среднего балла
по обществознанию на 0,24 балла.
3. Обобщенная линейная
модель множественной регрессии. С гетероскедастичными
остатками.
На основе предыдущего задания
мы выявили, что значимыми являются факторы
х6 и х7. Теперь определим,
существует ли у этих факторов гетероскедастичные
остатки.
Д (Ei) = const - гомоскед.
Д (Ei) = (не равно)
const – гетероск.
Берём фактор х6 рядом с ним
в Excel ставим последние остатки полученные
нами во время устранения мультиколлинеарности.
Дальше через вставку функции (АВS) определяем
е\.