Автор работы: Пользователь скрыл имя, 12 Декабря 2013 в 22:40, контрольная работа
Из генеральной совокупности , распределенной по нормальному закону, извлечена выборка. Требуется:
1. Составить вариационный, статистический и выборочный ряды распределения; найти размах выборки;
По полученному распределению выборки:
2. Построить полигон относительных частот;
3. Построить график эмпирической функции распределения;
4. Вычислить выборочную среднюю, выборочную дисперсию, выборочное исправленное среднее квадратическое отклонение, моду и медиану;
Задача 1 3
Задача 2 7
Задача 3 13
Задача 4 15
Задача 5 24
Задача 6 27
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
1) t-статистика. Критерий Стьюдента.
С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений x и y).
Для оценки статистической
значимости коэффициентов регрессии
и корреляции рассчитываются t-критерий
Стьюдента и доверительные
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой)
гипотезы выдвигают гипотезу о незначимом
отличии от нуля параметра или
статистической характеристики в генеральной
совокупности. Наряду с основной (проверяемой)
гипотезой выдвигают
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).
Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение
t-критерия меньше табличного (по модулю),
то нет оснований отвергать
tкрит (n-m-1;α/2) = (12;0.025) = 2.179
Поскольку 13.51 > 2.179, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 3.97 > 2.179, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные
интервалы коэффициентов
(b - tкрит Sb; b + tкрит Sb)
(0.54 - 2.179 • 0.0402; 0.54 + 2.179 • 0.0402)
(0.46;0.63)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкрит Sa; a + tкрит Sa)
(9.32 - 2.179 • 2.35; 9.32 + 2.179 • 2.35)
(4.2;14.43)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
2) F-статистика. Критерий Фишера.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая
гипотеза о том, что уравнение
в целом статистически
2. Далее определяют фактическое значение F-критерия:
где m=1 для парной регрессии.
3. Табличное значение
определяется по таблицам
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=12, Fтабл = 4.75
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Предположим, что в педагогическом эксперименте участвовали три группы студентов по 10 человек в каждой. В группах применили различные методы обучения: в первой – традиционный , во второй – основанный на компьютерных технологиях , в третьей – метод, широко использующий задания для самостоятельной работы . Знания оценивались по десятибалльной системе.
Требуется обработать полученные данные об экзаменах и сделать заключение о том, значимо ли влияние метода преподавания, приняв за уровень значимости .
Результаты экзаменов заданы таблицей, – уровень фактора – оценка -го учащегося обучающегося по методике .
5.10.
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 | |
Уровень фактора
|
|
3 |
6 |
5 |
6 |
8 |
3 |
5 |
4 |
5 |
3 |
|
6 |
8 |
5 |
10 |
9 |
9 |
8 |
7 |
9 |
10 | |
|
5 |
4 |
4 |
6 |
6 |
6 |
8 |
6 |
7 |
8 |
Решение
Поместим в таблице экзаменационные оценки ( ), их отклонения от общей средней ( ) и квадраты этих отклонений . Уровни фактора означают: - традиционный метод, - применение компьютерной технологии, - увеличение доли самостоятельной работы.
Номер испытан.1 |
Уровни фактора (различные методы преподавания) | ||||||||
|
|
| |||||||
Оценки |
|
|
Оценки |
|
|
Оценки |
|
| |
1 |
3 |
-2 |
4 |
6 |
-2 |
4 |
5 |
-1 |
1 |
2 |
6 |
1 |
1 |
8 |
0 |
0 |
4 |
-2 |
4 |
3 |
5 |
0 |
0 |
5 |
-3 |
9 |
4 |
-2 |
4 |
4 |
6 |
1 |
1 |
10 |
2 |
4 |
6 |
0 |
0 |
5 |
8 |
3 |
9 |
9 |
1 |
1 |
6 |
0 |
0 |
6 |
3 |
-2 |
4 |
9 |
1 |
1 |
6 |
0 |
0 |
7 |
5 |
0 |
0 |
8 |
0 |
0 |
8 |
2 |
4 |
8 |
4 |
-1 |
1 |
7 |
-1 |
1 |
6 |
0 |
0 |
9 |
5 |
0 |
0 |
9 |
1 |
1 |
7 |
1 |
1 |
10 |
3 |
-2 |
4 |
10 |
2 |
4 |
8 |
2 |
4 |
Груп. сред.2 |
4,8 |
8,1 |
6,0 |
||||||
S |
24 |
25 |
18 |
1 Номер испытания (порядковый номер студента группы).
2 Групповая средняя (средний балл группы).
Общая средняя равна
.
; .
.
В нашем примере p=3 (p - количество факторов), q=10 (q - количество студентов), поэтому для степеней свободы получаются следующие значения: pq-1=29, p-1=2, p(q-1)=27.
Находим выборочные дисперсии: ; ; .
Примем в качестве нулевой гипотезу о том, что выявленное различие групповых средних (средних баллов) случайно, т.е. при уровне значимости a=0,05 средние баллы совпадают.
Для проверки этой гипотезы следует воспользоваться F-критерием Фишера-Снедекора. Вычисляется .
По таблицам находится критическая точка . Здесь a - уровень значимости, - число степеней свободы для дисперсии (в числитель формулы вписывается большая из дисперсий), - число степеней свободы для меньшей дисперсии . В случае нулевая гипотеза принимается, в случае она отвергается.
В примере .
Таким образом, нулевая гипотеза отвергается, и следует считать, что средние баллы групп различаются "значимо". В частности, повышение качества знаний под воздействием уровня фактора F нельзя считать случайным.
По промышленным предприятиям города имеются следующие данные за отчетный год:
№ предприятия |
Объем продукции, млн.руб. |
Среднегодовая стоимость Основных средств, млн.руб. |
Среднесписочное число работников, чел. |
Прибыль, млн.руб. |
1 |
197,7 |
10,0 |
900 |
13,5 |
2 |
592,0 |
22,8 |
1500 |
136,2 |
3 |
465,5 |
18,4 |
1412 |
97,6 |
4 |
296,2 |
12,6 |
1200 |
44,4 |
5 |
584,1 |
22,0 |
1485 |
146,0 |
6 |
480,0 |
19,0 |
1420 |
110,4 |
7 |
578,5 |
21,6 |
1390 |
138,7 |
8 |
204,7 |
9,4 |
817 |
30,6 |
9 |
466,8 |
19,4 |
1375 |
111,8 |
10 |
292,2 |
13,6 |
1200 |
49,6 |
11 |
423,1 |
17,6 |
1365 |
105,8 |
12 |
192,6 |
8,8 |
850 |
30,7 |
13 |
360,5 |
14,0 |
1290 |
64,8 |
14 |
208,3 |
10,2 |
900 |
33,3 |
Информация о работе Контрольная работа по "Математическая статистика"