Обработка опытных данных.Статистические гипотизы и выводы

Автор работы: Пользователь скрыл имя, 20 Ноября 2013 в 12:08, реферат

Описание работы

Несмотря на значительные достижения современной науки и инженерии в области изучения сложных механических систем, многие вопросы остаются пока за гранью возможностей теоретического исследования. Для их решения приходится прибегать к изучению поведения реального объекта или его физической модели под воздействием внешних причин в конкретных условиях, т.е. к проведению эксперимента. Это относится как к непосредственным научным исследованиям, так и к инженерным технологическим задачам на действующем производстве.

Содержание работы

Введение 5
1. Экспериментальные исследования 6
1.1. Виды экспериментальных исследований 6
1.2. Объект экспериментального исследования 7
2. Статистическое оценивание
2.1. Понятие вероятности 10
2.2. Случайные величины и их характеристики 12
2.3. Распределения, связанные с нормальным 23
2.4. Выборки. Статистические оценки 25
2.5. Точечные оценки 29
2.6. Интервальные оценки 31
2.7. Планирование эксперимента при оценивании числовых
характеристик случайной величины 37
3. ПРОВЕРКА СтатистическИХ ГИПОТЕЗ
3.1. Статистические гипотезы и критерии согласия 40
3.2. Критерий для отбрасывания резко
выделяющихся результатов испытаний 44
3.3. Проверка гипотез о числовых значениях параметров
нормального распределения 47
3.4. Критерий согласия. Проверка гипотез о виде функции
распределения 59
4. Пример анализа опытных данных 65
Библиографический список 81
Приложение. статистические таблицы 82

Файлы: 1 файл

Обработка опытных данных.Статистические гипотизы и выводы. Книга 1.doc

— 2.23 Мб (Скачать файл)

В некоторых случаях удобней  воспользоваться эквивалентным  неравенством, связанным с F-распределением

,                                         (2.41)

где n - количество степеней свободы (n=N-1); a - уровень значимости (a=1-p); - квантиль распределения Фишера, значение которой при заданном уровне значимости a и числе степеней свободы n может быть определено из таблиц (см. табл. П4 и П5), принимая n1=n и n2=¥.

Решение неравенств (2.40) и (2.41) ищется методом подбора.

 

3. ПРОВЕРКА СтатистическИХ  ГИПОТЕЗ

 

3.1. Статистические гипотезы  и критерии согласия

При использовании экспериментальных  методов для решении конкретных практических задач часто приходится делать некоторые предположения относительно свойств одной или нескольких генеральных совокупностей основываясь на имеющихся выборках ограниченного объема. Такие предположения являются статистическими гипотезами.

По ГОСТ 15895-77. Статистической гипотезой называют любое предположение, касающееся неизвестного распределения случайной величины в совокупности.

Роль статистических гипотез при  обработке экспериментальных данных весьма высока. Без них невозможно обойтись даже при попытке численно охарактеризовать случайную величину на основе выборки, при построении точечных и интервальных оценок.

При построении точечных и интервальных оценок высказывалось  предположение, что случайная величина подчиняется нормальному закону распределения. Кроме того, всегда подразумевалось что все выборочные значения принадлежат одной и той же генеральной совокупности (нет резко выделяющихся значений).

Тем более невозможно обойтись без  статистических гипотез если возникает задача сравнения двух или более случайных величин.

Идея формирования и проверки статистических гипотез состоит в следующем. Пусть для некоторого числового параметра случайной величины Q по выборке объема N вычислена некоторая оценка . Пусть имеется причина предположить, что истинное значение параметра Q, т.е. его значение в генеральной совокупности, равно Q0 . Это предположение следует проверить на практике, то есть по имеющимся опытным данным выборки. Такое проверяемое предположение называют нулевой гипотезой Н0 и записывают в виде соотношения Н0: Q=Q0. Даже если нулевая гипотеза справедлива, то выборочное значение обычно не совпадает точно с Q0 , поскольку оно является лишь одним из конкретных значений случайной величины , порожденной случайными выборками объема N. Если известна функция распределения оценки , построенная теоретически в предположении справедливости нулевой гипотезы, то с ее помощью можно найти такую зону, вероятность попадания в которую мала (равна малому значению a). Эта зона может использоваться в качестве некоторой критической области, то есть области, попадание в которую оценки дает основания отвергнуть выдвинутую нулевую гипотезу.

Нулевой гипотезой обычно называют гипотезу, имеющую наиболее важное значение в проводимом исследовании. Ее обозначают Н0.

По ГОСТ 15895-77. Нулевая гипотеза это гипотеза, подлежащая проверке.

Нулевую гипотезу выдвигают и затем  проверяют с помощью статистических критериев с целью выявления оснований для ее отклонения и принятия альтернативной гипотезы.

По ГОСТ 15895-77. Альтернативная гипотеза - каждая допустимая гипотеза, отличная от нулевой. Ее обозначают НА или Н1.

Обычно при проверке статистических гипотез в качестве конкретной альтернативной гипотезы, из всех возможных, выбирают гипотезу, имеющую в проводимом исследовании второе по важности значение после нулевой.

Если имеющийся статистический материал не позволяет отвергнуть нулевую гипотезу, то ее принимают и используют в качестве рабочей до тех пор, пока новые результаты испытаний не позволяют ее отклонить.

По ГОСТ 15895-77. Статистический критерий - однозначно определенный способ проверки статистических гипотез.

В основе критерия лежит некоторое  известное теоретическое распределение случайной величины. По опытным данным рассчитывают некоторую случайную величину, называемую статистикой, относящуюся к данному критерию и имеющую то же распределение .

Статистикой для проверки гипотез называют функцию g(x1,x2,...,xN) результатов наблюдений составляющих выборку x1,x2,...,xN, однозначно связанную с принятым статистическим критерием и определяемую им.

Все возможные значения статистики для проверки гипотезы делят на две  части: область принятия нулевой гипотезы и критическую область.

По ГОСТ 15895-77. Критической областью называют область со следующими свойствами: если значения применяемой статистики принадлежит данной области, то отвергают нулевую гипотезу; в противном случае ее принимают.

Проверка гипотезы сводится к выяснению  того, в какую область попало рассчитанное значение статистики: если оно попало в критическую область, то нулевая гипотеза отвергается, а если в область принятия нулевой гипотезы, то принимается.

Так как эти решения базируются на статистиках, найденных по выборкам ограниченного объема (то есть на случайных  величинах), то при принятии решения всегда возможны ошибки. При статистической проверке гипотез возможны четыре исхода, из них два ошибочные - ошибки первого и второго рода:

Нулевая гипотеза

Объективно верна 

Объективно не верна

Принимается

Правильное решение

Ошибка 2-го рода

Отвергается

Ошибка 1-го рода

Правильное решение


По ГОСТ 15895-77. Уровень значимости это вероятность ошибки первого рода. Обозначим уровень значимости через a. Обычно выбирают a=0.01, a=0.1, и наиболее часто a=0.05.

Вероятность совершить ошибку второго рода, т.е. принять объективно неверную гипотезу, обозначим b. Величину p=1-b называют мощностью критерия. Обычно величиной a задаются и стараются использовать такой критерий, чтобы значение мощности p было наибольшим.

По ГОСТ 15895-77. Мощность критерия это вероятность того, что нулевая гипотеза будет отвергнута, если альтернативная гипотеза верна.

 

Критические области бывают односторонние  и двухсторонние. Смысл этих областей показан на рис. 3.1.

  Рис. 3.1. Критические области  плотности распределения:

а. - правосторонняя; б. - левосторонняя; в. – двусторонняя

 

Точки, отделяющие области принятия нулевой  гипотезы от критических областей называют границами критической области. Обычно их определяют как квантили используемого теоретического распределения, которому подчиняется статистика для проверки гипотез.

Если хотят убедиться в том, что одна случайная величина строго больше другой (или строго меньше другой), то используют одностороннюю критическую область.

В этом случае  Н0: Q=Q0,

Н1: Q>Q0  или Н1: Q<Q0.

Если проверяют как положительные, так и отрицательные расхождения  между изучаемыми величинами, то используют двусторонние критические области .

В этом случае Н0: Q=Q0,

  Н1: Q¹Q0.

Алгоритм проверки статистических гипотез сводится к последовательному выполнению следующих операций:

  1. Формулируют нулевую гипотезу Н0;
  2. Формулируют альтернативную гипотезу Н1;
  3. Выбирают критерий для проверки Н0;
  4. Рассчитывают статистику относящуюся к выбранному критерию;
  5. Находят границы критической области при выбранной альтернативной гипотезе Н1;
  6. Проверяют попадание рассчитанной статистики в критическую область и делают вывод о справедливости выдвинутой нулевой гипотезы.

Все последующее рассмотрение будем  проводить в соответствии с этим алгоритмом.

При использовании механизма проверки статистических гипотез следует помнить, что даже в случае принятия нулевой гипотезы, в 100×a% случаев вывод будет ошибочным в связи со всегда имеющейся вероятностью совершить ошибку первого рода.

 

3.2. Критерий для отбрасывания  резко выделяющихся

результатов испытаний

Разброс экспериментальных данных вокруг некоторого центра рассеянья  является нормальным явлением и объясняется  одновременным воздействием множества  неконтролируемых слабо влияющих факторов. Но порой в общем массиве опытных данных появляются величины резко отличающиеся от остальной массы значений, а следовательно не принадлежащие рассматриваемой генеральной совокупности данных. Они могут появиться вследствие изменения условий эксперимента, грубых ошибок проводимых измерений, неправильной записи результатов и т.д. Полученные ошибочные опытные данные могут существенно повлиять на окончательные результаты эксперимента и должны быть исключены из рассмотрения. Для исключения сомнительных данных применяют специальные критерии. Они позволяют сделать объективное, обоснованное заключение о принадлежности или не принадлежности сомнительных данных к рассматриваемой генеральной совокупности данных.

Нулевой гипотезой при использовании  этих критерием является предположение о том, что все опытные данные хi принадлежат одной и той же генеральной совокупности Х. Альтернативная гипотеза состоит в том, что одно или более из значений xi являются грубыми ошибками и не принадлежат генеральной совокупности:

    1. Н0: хiÎХ ;
    2. Н1: хiÏХ .

В качестве такого подозрительного значения xi может выступать либо наибольшее, либо наименьшее значение из всех опытных данных. Причем, первым на принадлежность генеральной совокупности следует проверить то значение xi, которое отстоит наиболее далеко от эмпирического центра распределения (2.26):

.                  (3.1)

Возможны две ситуации: когда  для полученной выборки опытных  данных известно значение генеральной дисперсии s2, и когда s2 не известно, но можно рассчитать ее оценку - выборочную дисперсию s2.

 

3.2.1. Критерий для отбрасывания  резко выделяющихся 

результатов испытаний  при известной генеральной дисперсии

Ситуация, когда известна генеральная  дисперсия s2 и неизвестно математическое ожидание встречается довольно часто. Как правило, она характерна для приемочных испытаний проводимых на предприятиях занятых выпуском однотипной продукции с различными номинальными параметрами в течение длительного периода времени.

Например: Плавочные и  технологические колебания механических свойств при производстве проката, труб или прессованных изделий при значимом их влиянии на уровень механических свойств практически не влияют на дисперсию этих свойств. В связи с этим большой объем результатов приемочных контрольных испытаний позволяет достаточно точно и надежно оценить генеральную дисперсию характеристик механических свойств.

 

Рассмотрение проведем в соответствии с общим алгоритмом из п. 3.1.

1) Н0: хiÎХ .

2) Н1: хiÏХ .

  1. В качестве статистического критерия при известной генеральной дисперсии s2 следует использовать t -критерий [6].
  2. Статистика этого критерия имеет вид      ,                                   (3.2)

где s - генеральное стандартное отклонение (2.22).

  1. Границы критической области можно установить при помощи критического значения критерия ta, N, взятым из табл. П6 приложения для уровня значимости a и объема выборки N.
  2. Если выполняется неравенство , то статистика t попадает в область принятия нулевой гипотезы, результат испытаний xi не следует считать выбросом и он должен учитываться как и остальные N-1 результатов. При статистика t попадает в критическую область, результат испытаний xi является ошибочными и должны быть исключены их рассмотрения, а найденная ранее оценка математического ожидания должна быть скорректирована.

 

 

 

 

3.2.2. Критерий Н.В.Смирнова

Этот  критерий применяется для наиболее часто встречающихся случаев, когда  генеральные характеристики неизвестны, а известны лишь их оценки s2 и , произведенные на основании анализируемой выборки. Следует проверить принадлежность результата испытаний xi генеральной совокупности опытных данных. Используем общий алгоритм из п. 3.1.

1) Нулевая и альтернативная гипотезы  принимаются прежними.

     Н0: хiÎХ .

2) Н1: хiÏХ .

 

  1. В качестве статистического критерия используется u -критерий [6].
  2. Статистика этого критерия имеет вид      ,                                    (3.3)

где s- выборочное стандартное отклонение (2.35).

  1. Границы критической области можно установить при помощи критического значения критерия ua, N, взятого из табл. П7 приложения для уровня значимости a и объема выборки N.
  2. Если выполняется неравенство , то статистика u попадает в область принятия нулевой гипотезы, результат испытаний xi не следует считать выбросом и он должен учитываться как и остальные N-1 результатов. При статистика u попадает в критическую область, результат испытаний xi является ошибочными и должны быть исключены их рассмотрения, а найденная ранее оценка математического ожидания и дисперсии должны быть рассчитаны вновь.

 

3.3. Проверка гипотез  о числовых значениях параметров

нормального распределения

Значения  выборочных числовых характеристик  случайных величин зависят от размера и состава выборки и так же являются случайными величинами. Следовательно, они сами обладают определенным рассеиванием и собственными вероятностными характеристиками. Поэтому если при расчете оценок числовых характеристик по различным выборкам получено расхождение в числовых значениях, то это еще не означает, что оцениваемые генеральные характеристики этих величин не равны. Просто может оказаться, например, что выборки взяты из различных мест одной и той же генеральной совокупности. Но, так как генеральная совокупность одна, то и ее числовые характеристики едины.

Однако, расхождение может быть и не случайным, а носить вполне закономерный характер.

Часто при решении практических задач  возникает необходимость определения значимости или случайности в расхождении выборочных характеристик между собой, а также выборочных и известных генеральных характеристик. Наибольшее практическое значение имеет сравнение средних значений и выборочных дисперсий экспериментально полученных выборок результатов наблюдений и выводы о свойствах соответствующих генеральных характеристик, полученные на основании этих сравнений.

Информация о работе Обработка опытных данных.Статистические гипотизы и выводы