Проверка статистических гипотез

Автор работы: Пользователь скрыл имя, 08 Ноября 2013 в 22:12, практическая работа

Описание работы

Теория вероятностей является теоретической основой математической статистики. За последние годы отделилась в самостоятельные дисциплины теория надежности, теория массового обслуживания и теория информации. Вопросы организации и планирования производства также связан с необходимостью учета случайных событий и, следовательно, не могут быть решенные без применения теории вероятностей.

Содержание работы

1.Введение
2.Основные понятия статистической гипотезы.
3.Проверка статистических гипотез.
4.Подробное решение задач.
5.Заключение
6.Список использованной литературы

Файлы: 1 файл

samost_rabota_po_mat_Vite.doc

— 271.50 Кб (Скачать файл)

 

ГБОУ ВПО КГМУ

Кафедра физики, информатики и математики

 

Зав. кафедрой физики,

 информатики и математики,

 доцент Снегирева Л.В.

 

Самостоятельная работа №1

«Проверка статистических гипотез»

 

                                                                                                                 Выполнила:

 студентка стоматологического факультета

1 курса 6 группы

 Семёнова Анастасия Андреевна

Проверила:

Новичкова Татьяна Александровна

 

 

 

 

 

 

Курск 2013

План 

  1. Введение
  2. Основные понятия статистической гипотезы.
  3. Проверка статистических гипотез.
  4. Подробное решение задач.
  5. Заключение
  6. Список использованной литературы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

Теория вероятностей является теоретической основой математической статистики. За последние годы отделилась в самостоятельные дисциплины теория надежности, теория массового обслуживания и теория информации. Вопросы организации и планирования производства также связан с необходимостью учета случайных событий и, следовательно, не могут быть решенные без применения теории вероятностей.

Статистический анализ является необходимым этапом анализа и  исследования любой производственно-хозяйственной, финансовой или коммерческой деятельности как отдельной фирмы, организации  или предприятия, так и совокупности предприятий и организаций, отрасли или страны, в целом.

Цель самостоятельной  работы :овладеть основными понятиями  статистической проверки гипотез, так  же сформировать навыки по решению  задач на проверку статистических гипотез.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.Основные понятия  статистической гипотезы.

Статистической  называют гипотезу в виде неизвестного распределения или о параметрах известных распределений.

Нулевой (основной) гипотезой  называют вдвинутую гипотезу .

Конкурирующей(альтернативной) называют гипотезу , которая противоречит нулевой.

Различают гипотезы, которые  содержат одно и более одного предположений. Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит  из конечного или бесконечного числа гипотез.

В итоге поверки гипотезы могут быть  допущены ошибки двух родов.

Ошибка первого рода состоит  в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают .

Ошибки второго рода  состоит в том, что будет принята  неправильная нулевая гипотеза.

Вероятность ошибки второго  рода обозначается .

Статистическим  критерием (или просто критерием)называют случайную величину  K.Которая служит для проверки гипотезы.

Наблюдаемым   эмпирическим  значением  называют то значение критерия, которое вычислено по выборкам.

Критической областью  называют совокупность  значений критерия , при которых нулевую гипотезу отвергают .

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при  которых нулевую гипотезу принимают.

Основной принцип проверки статистических гипотез:если наблюдаемое  значение критерия принадлежит критической области, то нулевую гипотезу отвергают;если  наблюдаемое значение критерия принадлежит  области принятия гипотезы, то гипотезу принимают.

Критическими точками (границами) называют точки, отделяющие  критическую область от области принятия гипотезы.

Правосторонней называют  критическую область, определяемую неравенством:

  где -положительное число

Левосторонней называют критическую  область , определяемую неравенством:

 где  -отрицательное число.

Двусторонней называют критической  областью, определяемую неравенством:

.

В частности, если критические  точки симметричны относительно  нуля , то двусторонняя критическая область  определяется неравенствами (В предложении, что  или равносильным неравенством .

Для отыскания  критической области задается уровнем  значимости и ищут  критические точки , исходя из следующих соотношений:

 А) для  правосторонней критической области  : ;

Б) для левосторонней  критической области : )= <0);

В) для двусторонней критическойобласти:

.

Мощность критерия называют вероятность попадания 4ритерия  в критическую область при  условии, что справедлива конкурирующая  гипотеза. Другими словами, мощность критерия  есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка  статистических гипотез.

Проверка статистической гипотезы о математическом ожидании

 Проверка  статистической гипотезы о математическом  ожидании нормального распределения  при известной дисперсии.

Пусть имеется  нормально распределенная случайная  величина ,

определенная  на множестве объектов некоторой  генеральной

совокупности. Известно, что  = . Математическое ожидание

неизвестно. Допустим, что имеются основания предполагать, что = a,

где a – некоторое  число (такими основаниями могут  быть ограниченные

сведения об объектах генеральной совокупности, опыт исследования

подобных совокупностей  и т. д.). Будем считать также, что  имеется другая

информация, указывающая на то, что     = a1, где a1 > a.

I. Выдвигаем  нулевую гипотезу H0:  = a;

при конкурирующей  гипотезе H1: = a1.

Делаем выборку  объема n: x1, x2,..., xn . В основе проверки лежит тот

факт, что случайная  величина (выборочная средняя) распределена по

нормальному закону с дисперсией   /n и математическим ожиданием,

равным a в случае справедливости H0, и равным a1 в случае

справедливости H1.

Очевидно, что  если величина x оказывается достаточно малой, то

это дает основание  предпочесть гипотезу H0 гипотезе H1. При достаточно

большом значении x более вероятна справедливость гипотезы H1. Задачу

можно было бы поставить  так: требуется найти некоторое  критическое

число, которое  разбивало бы все возможные значения выборочной

средней ( в условиях данной задачи это все действительные числа ) на два

полубесконечных промежутка. При попадании   в левый промежуток

следовало бы принимать  гипотезу H0, а при попадании  в  правый

промежуток  предпочтение следовало бы оказать  гипотезе H1. Однако на

самом деле поступают несколько иначе.

В качестве статистического  критерия выбирается случайная

величина

,

распределенная  по нормальному закону , причем = 0 и Dz = 1 ( это

следует из свойств  математического ожидания и дисперсии ) в случае

справедливости  гипотезы H0. Если справедлива гипотеза H1, то

 

 

Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей

Рассмотрим две случайные  величины Х и Y, каждая из которых  подчиняется нормальному закону с дисперсиями . Пусть из этих генеральных совокупностей извлечены две выборки объемами n1 и n2. Проверим гипотезу Н0 о том , что относительно альтернативной гипотезы Н1, заключающейся в том, что

Однако мы располагаем  только выборочными дисперсиями  и .

 

Задача проверки гипотезы Н0 сводится к сравнению выборочных дисперсий.

Для построения критической  области с выбранной надежностью  необходимо исследовать совместный закон распределения оценок  и  и . Таким законом распределения является распределение Фишера – Снедекора (или F - распределение).

Рассмотрим случайную величину x, распределенную нормально с математическим ожиданием Х и с дисперсией . Произведем две независимые выборки объемами п1 и п2. Для оценки используют выборочные дисперсии. Случайную величину, определяемую отношением , называют величиной с распределением Фишера-Снедекора. Имеются таблицы для дифференциального закона распределения Фишера-Снедекора, которые зависят лишь от объема выборки и уровня значимости , где ,где .

Вернемся снова  к задаче проверки гипотезы о равенстве  дисперсий. Сначала нужно вычислить выборочные дисперсии. Найдем отношение , причем в числителе поставим большую из двух оценок дисперсии. Выберем уровень значимости и из таблиц находим число ,   которое сравнивается с вычисленным F. Если окажется, что , то проверяема гипотеза Н0 отвергается, в противном случае делается вывод о том, что наблюдения не противоречат проверяемой гипотезе.

Проверка гипотезы о законах распределения (критерий Фишера).

Существует  несколько критериев согласия для  проверки законов распределения  случайной величины. Это критерии Колмогорова, Смирнова, Пирсона и др. Мы остановимся лишь на критерии Пирсона – это наиболее часто употребляемый критерий для проверки закона распределения случайной величины.

Сначала нужно  разбить всю область изменения случайной величины на L интервалов (бин). Затем нужно подсчитать сколько этих величин попадает в каждый бин, то есть подсчитать эмпирические частоты тк. Чтобы вычислить теоретические частоты нужно вероятность попадания в каждый бин рк умножить на объем выборки n. Таким образом, статистика .

 

 является  случайной величиной, подчиняющейся  закону c    степенями свободы. В последней формуле r – число параметров распределения, определяемых по выборке. Для нормального закона – это два параметра, для закона Пуассона – один и т.д.

Рассчитав значения  и выбрав уровень значимости , по таблице - распределения определяют . Если , то гипотезу Н0 отвергают, если то гипотезу принимают.

 

 

 

 

Практическое  решение задач

A)Решение.

В данном случае  нулевая  гипотеза, которую следует проверить, состоит в равенстве средних  значений пульса в 2 генеральных совокупностях  больных, подвергающихся данной процедуре.

Далее по формуле 

  = =

Полученное значение сравнивают с критическим значением распределения Стьюдента(таблица приложения), где f= , а -уровень значимости.

F=10+12-2=20

Поскольку  , отсюда следует вывод что, нулевую гипотезу о равенстве генеральных дисперсий отвергаем.

В)При выборке объемом  найдена средняя масса таблеток, взятых из первой партии; при выборке объемом найдена средняя  масса таблеток взятых из первой партии .Оценки дисперсий и .При уровне значимости выяснить , можно ли считать различие в средних масс таблеток случайными.

Решение.

По формуле 

 

 

 

 

.

Полученное значение сравнивают с критическим значением  распределения Стьюдента(таблица приложения), где f= , а -уровень значимости.Находим

F=50=40-2=88

Вывод .Так как   , то при уровне  значимости Р=0,05 нулевую гипотезу отвергают в пользу конкурирующей и считать различие в средних значениях масс  таблеток неслучайным.

С)По двум независимым выборкам, объемы которых и , извлеченным из нормальных генеральных совокупностей Х и Y, найдены исправленные выборочные дисперсии и .При уровни значимости  Р=0,05 проверить нулевую гипотезу: D(x)=D(y) о равенстве генеральных дисперсий, при конкурирующей гипотезе Н1:D(x)>D(y) .

Решение.

По независимым выборкам , объемы которых  и ,извлечены из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии и .Требуется сравнить выборочные дисперсии.

Для того  чтобы при  заданном уровне значимости найти Р  найти нулевую гипотезу: D(x)=D(y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н1:D(x)>D(y), надо вычислить наблюдаемое значения критерия(отношение большей к меньшей):

По таблице критических точек распределения Фишера – Снедокора, по заданному уровню значимости =0,05 и числам степеней свободы , находим критическую точку: и получается =2,67.

Так как < -нет оснований отвергнуть нулевую гипотезу. Если > , то нулевую гипотезу отвергают.

d)По двум независимым выборкам , объемы которых и , извлечены из нормальных генеральных совокупностей X и Y,найдены выборочные дисперсии Db(x)=14,4 и Db(y)=20,5. При уровне значимости 0,1 проверить нулевую гипотезу Н0: D(x)=D(y) равенстве генеральных дисперсий при конкурирующей гипотезе Н1:D(x)≠D(y).

Решение.

По независимым выборкам , объемы которых  и ,извлечены из нормальных  генеральных совокупностей, найдены исправленные выборочные дисперсии и .Требуется сравнить выборочные дисперсии .Для того  чтобы при заданном уровне значимости найти α найти нулевую гипотезу: D(x)=D(y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н1:D(x)>D(y), надо вычислить наблюдаемое значения критерия(отношение большей к меньшей):

По таблице критических  точек распределения Фишера –  Снедокора, по заданному уровню значимости =0,05 и числам степеней свободы , находим критическую точку: и получается .

> , то нулевую гипотезу отвергают.

F)Для определения значения коэффициента поверхностного натяжения раствора использованы два метода.

Результаты первого  метода(Х):60,4;58,8; 61,3; 57,1; 57,9;59,2; 60,8; 61,7; 62,9; 56,9;  57,7.

Результаты второго  метода (Y) : 49,8; 48,1; 50,1; 49,5; 50,6; 50,3; 48.8; 48,7; 50.0;49,6; 49,1; 50,4.

Полагая, что результаты измерений, проведенные двумя методами (случайные величины) имеют нормальное распределение, при  уровне значимости р=0,1 проверить нулевую гипотезу о равенстве генеральных дисперсий  при конкурирующей гипотезе , состоящей в их неравенстве.

Информация о работе Проверка статистических гипотез