Автор работы: Пользователь скрыл имя, 17 Марта 2013 в 08:10, реферат
Гипотезы проверяются с помощью статистических критериев (обозначается в общем виде R). Статистический критерий – это правило, которое позволяет принимать истинную и отклонять ложную гипотезу с высокой вероятностью или другими словами на определенном уровне значимости -a (т.е. с указанием ошибки 1-ого рода, которая возникает в результате отклонения по результатам выборочного исследования истинной нулевой гипотезы; принятие истинной гипотезы Н0 характеризуется доверительной вероятностью 1-a; ошибка 2-ого рода b возникает в результате принятия по результатам выборочного исследования ложной Н0;
Теоретическая часть………………………………………………………………………………………3
Критерий Стьюдента……………………………………………………………………………………..5
F -- критерий Фишера………………………………………………………………………………...…10
Критерий χ2 Пирсона ………………………………………………………………………12
Критерий Манна-Уитни………………………………………………………………………………...15
Теоретическая часть…………………………………………………………………
Критерий Стьюдента………………………………
F -- критерий Фишера………………………………………
Критерий χ2 Пирсона ………………………………………………………………………12
Критерий Манна-Уитни…………………………
Гипотезы проверяются с помощью статистических критериев (обозначается в общем виде R). Статистический критерий – это правило, которое позволяет принимать истинную и отклонять ложную гипотезу с высокой вероятностью или другими словами на определенном уровне значимости -a (т.е. с указанием ошибки 1-ого рода, которая возникает в результате отклонения по результатам выборочного исследования истинной нулевой гипотезы; принятие истинной гипотезы Н0 характеризуется доверительной вероятностью 1-a; ошибка 2-ого рода b возникает в результате принятия по результатам выборочного исследования ложной Н0; отклонение ложной Н0 характеризуется вероятностью 1-b и называется мощностью критерия. Два вида ошибок связаны между собой так же, как и нулевая и альтернативная гипотезы. Математическая статистика позволяет точно указывать только вероятность ошибки 1-ого рода. Оценить вероятность ошибки 2-ого рода чаще всего трудно. (И лишь в некоторых случаях, она может быть оценена примерно).
Обычно a принимает следующие значения: 0,10; 0,05; 0,01; 0,001. Начинают с наименьшего значения.
Пример: если мы указываем, что сходства-различия достоверны (статистически значимы) на 5% уровне значимости, то это означает, что вероятность того, что они недостоверны, составляет 0,05 (а доверительная вероятность 0,95=1-0,05). Естественно, вероятности могут указываться как в десятичном, так и процентном измерении.
Статистический критерий часто представляет собой формулу, по которой получают некоторое число.
Критерии делятся на:
Примеры критериев:
t-критерий Стьюдента: применяется для сравнения (установления сходства – различий) средних в выборках, установления отличий от 0 некоторых мер связи: коэффициента линейной корреляции Пирсона, ранговой корреляции Пирсона, точечно-бисериального и рангово-бисериального и коэффициента линейной регрессии (см.ниже).
F-критерий Фишера: для сравнения дисперсий в выборках, установления отличий от 0 коэффициента детерминации, установления наличия-отсутствия влияния фактора в дисперсионном анализе.
c2 (хи-квадрат) Пирсона: для установления сходства-различия (сравнения) между эмпирическими и теоретическими частотными распределениями и проверка отличия от 0 коэффициентов сопряженности (j, Кч, С). Похожие задачи решает и критерий l (лямда) –Колмогорова-Смирнова.
Примеры: Q-критерий Розенбаума: выявление различий в уровне исследуемого признака на двух выборках испытуемых.
Н-критерий Крускала-Уоллиса и S-критерий Джонхира (аналогично, но в случае 3-х и более выборок испытуемых)
G-критерий знаков, Т-критерий Вилкоксона: оценка сдвига значений исследуемого признака в двух независимых выборках)
Критерий Х2r Фридмана и L-критерий тенденции Пейджа (для 3-х и более независимых выборок).
Критерии Крускала-Уоллиса, Фридмана, Джоннера и Пейджа являются непараметрическими аналогами дисперсионного анализа.
Примеры: j* Фишера – угловое преобразование Фишера, биномиальный критерий т и др.
Для большинства критериев порядок проверки следующий:
а) Подготовка данных (определение
и преобразование измерительной
шкалы (номинативная, порядковая, интервальная,
отношений и
б) Определение зависимости или независимости выборок
Независимыми называются выборки, в которых одни и те же признаки измерены (несвязанные измерения) на разных испытуемых, а зависимыми – выборки, образованные парными (связанными) результатами (с одним испытуемым в разных условиях, например, «до» и «после» или испытуемыми, связанными в определенном отношениях: близнецы, брат-сестра, муж-жена и т.д.).
с) Количество выборок (1,2,3 и т.д.)
Один и тот же критерий
может иметь различные
Формулировка общего вывода
проверки гипотезы может быть такой
(на примере критерия Стьюдента): «Проверка
различных средних
При использовании критерия необходимо знать ограничения, как по отношению к типу задач, так и к самим данным: количество, форма представления и т.д.
Критерий Стьюдента
С помощью критерия Стьюдента
можно решать задачи не только о
равенстве (неравенстве) центров распределения
двух выборок, но и о равенстве (неравенстве)
центра распределения выборки
Следует отметить, что распределение
Стьюдента не зависит от математического
ожидания и дисперсии генеральной
совокупности, зависит только от объема
выборки и является аналогом нормального
распределения для выборок
критерий t-распределения Стьюдента
t =
где S2 = — средневзвешенная дисперсия с числом степеней свободы n= n1+n2–2, a n1 и n2 – соответствующие объемы выборок.
При экспериментальных измерениях,
особенно в цеховых или полевых
условиях, нередко в массив данных
вкрапливаются так называемые “грубые
промахи”, которые являются результатом
усталости персонала, сбоя оборудования,
неполадок в технологическом
процессе и т.п. Некоторые из них
настолько выделяются на общем фоне,
что выловить их и отбросить не
составляет труда. Однако большинство
грубых промахов на глаз неразличимы
и поэтому могут вносить
Пусть имеется выборка объемом n, один из элементов которой X* вызвал подозрение, что он не принадлежит данной совокупности (является грубым промахом). Для всей выборки, включая X*, вычисляется среднее арифметическое и оценка дисперсии S2, которые формируют нормированное отклонение
.
Затем вычисляется критерий отбраковки
где t (q,n) – критерий Стьюдента с q уровнем значимости и n = n – 2 числом степеней свободы.
Если t<tкр(5%,n), то подозреваемое число X* следует оставить в выборке; если t (5%,q)<t<tкр(0,1%,q), то число X* можно оставить или выбросить по усмотрению исследователя; если t>tкр(0,1%,n), то число X* нужно обязательно исключать из выборки.
Пример 1.
Две установки должны напылять резисторы одинаковой величины. При измерениях получены следующие выборки (в Омах):
Установка 1: 1095, 1025, 938, 915, 1012, 980, 975, 990, 1000, 947;
Установка 2: 942, 938, 1010, 1030, 973, 915, 990, 970, 925, 1045, 1100, 1020, 985, 1082, 1065, 1090
Определить, одинаково ли налажены установки.
Решение сводится к проверке нулевой гипотезы H0: = против альтернативной H1: 1 2. Находим параметры выборочных распределений
= 987,7 Ом; S2 = 2587,1 Ом2; n1 = 10;
= 1005,0 Ом; S2 = 3605,7 Ом2 n2 = 16;
Затем по формуле
t = ,
находим средневзвешенную дисперсию
S2 =
S2 = (9,425871 + 15,436057) / (9 + 15) = 3223,7
с n = 9 + 15 = 24 степенью свободы и расчетное значение критерия Стьюдента
t =
По таблице распределения Стьюдента находим tтабл,(5%; n= 24) = 2,0639. Так как t<tтабл,, то нулевая гипотеза H0 о равенстве центров распределения принимается (с доверительной вероятностью Рдов=0,95 можно считать, что обе установки налажены одинаково).
Пример 2.
Установка напыления должна быть настроена на номинал 15 кОм, При измерениях получилась следующая выборка: 13,2; 14,7; 12,9; 15,3; 12,7; 13,8; 14,1; 12,8; 14,8; 13,5; 14,2; 16,2; 14,1; 13,9; 14,3; 15,1 кОм. Определить правильность настройки установки.
Решение сводится к проверке нулевой гипотезы H0: = 15,0 кОм против альтернативной H1: 15,0 кОм. Находим параметры выборочного распределения: = 14,1 кОм; S2 = 0,9427 кОм; n = 16. Так как величину надо сравнивать с константой C, то формула
t = , (1.27)
преобразуется
.
По таблице распределения Стьюдента находим tтабл,(5%; 15) = 2,1314. Так как t > tтабл,, то нулевая гипотезаH0 о равенстве центра выборочного распределения напыляемых резисторов величине 15 кОм отвергается и принимается альтернативная гипотеза H1 (с доверительной вероятностью Рдов=0,95 можно считать, что установка для напыления настроена неправильно).
Пример3.
Приобретенная партия с 20 резисторов с номинальным сопротивлением Rном =181 ом с указанным в сертификате допуском ± 5% . Провести проверку приобретенной партии и установить действительное отклонение сопротивления от указанного в сертификате и его достоверность . Закон распределения погрешностей принять нормальным.
таблица 1
№ |
Величина сопротивления (ом) Ri |
№ |
Величина сопротивления (ом) Ri |
1 |
178,5 |
11 |
179,8 |
2 |
180,1 |
12 |
183,3 |
3 |
183,3 |
13 |
180,7 |
4 |
184,8 |
14 |
187,6 |
5 |
180,5 |
15 |
181,8 |
6 |
185,1 |
16 |
180,9 |
7 |
182,5 |
17 |
180,8 |
8 |
186,5 |
18 |
180,3 |
9 |
182,9 |
19 |
185,3 |
10 |
179,3 |
20 |
181 |
2. Находим среднее арифметическое :
= = 182,25ом
3.Определяем среднее
sx= = 2,53 ом
4.Определяем среднее
0,566 ом
Поскольку не задано среднего квадратичного отклонения пользуемся распределением Стьюдента.
5. Находим дробь Стьюдента:
tp = 2,208
6. По таблице распределения
Стьюдента находим