Обработка опытных данных.Статистические гипотизы и выводы

Автор работы: Пользователь скрыл имя, 20 Ноября 2013 в 12:08, реферат

Описание работы

Несмотря на значительные достижения современной науки и инженерии в области изучения сложных механических систем, многие вопросы остаются пока за гранью возможностей теоретического исследования. Для их решения приходится прибегать к изучению поведения реального объекта или его физической модели под воздействием внешних причин в конкретных условиях, т.е. к проведению эксперимента. Это относится как к непосредственным научным исследованиям, так и к инженерным технологическим задачам на действующем производстве.

Содержание работы

Введение 5
1. Экспериментальные исследования 6
1.1. Виды экспериментальных исследований 6
1.2. Объект экспериментального исследования 7
2. Статистическое оценивание
2.1. Понятие вероятности 10
2.2. Случайные величины и их характеристики 12
2.3. Распределения, связанные с нормальным 23
2.4. Выборки. Статистические оценки 25
2.5. Точечные оценки 29
2.6. Интервальные оценки 31
2.7. Планирование эксперимента при оценивании числовых
характеристик случайной величины 37
3. ПРОВЕРКА СтатистическИХ ГИПОТЕЗ
3.1. Статистические гипотезы и критерии согласия 40
3.2. Критерий для отбрасывания резко
выделяющихся результатов испытаний 44
3.3. Проверка гипотез о числовых значениях параметров
нормального распределения 47
3.4. Критерий согласия. Проверка гипотез о виде функции
распределения 59
4. Пример анализа опытных данных 65
Библиографический список 81
Приложение. статистические таблицы 82

Файлы: 1 файл

Обработка опытных данных.Статистические гипотизы и выводы. Книга 1.doc

— 2.23 Мб (Скачать файл)

Для характеристики вариабельности (относительного разброса) случайной величины или сопоставления разбросов случайных величин с различными математическими ожиданиями применяют коэффициент вариации:

.                                                 (2.17)

Кроме перечисленных числовых характеристик  применяют центральные моменты  третьего и четвертого порядков.

 

 

 

Коэффициентом асимметрии А называют отношение центрального момента третьего порядка к кубу стандартного отклонения:

.                                                        (2.18)

Коэффициент асимметрии определен  таким образом, что для теоретического нормального закона распределения А=0. Отличие от нуля коэффициента асимметрии говорит об асимметричности закона распределения относительно математического ожидания. Если А<0, то это говорит о большем влиянии на величину дисперсии отрицательных отклонений, и наоборот (рис.2.4, а).

Эксцессом Е называется величина, определяемая выражением

.                                                 (2.19)

Эксцесс служит мерой “островершинности”, или “сжатости”, закона распределения случайной величины. Для теоретического нормального закона распределения Е=0. Если Е>0, то распределение имеет более острую вершину, чем у теоретического нормального распределения, оно более сжато, и наоборот (рис.2.4, б).

 

 Рис. 2.4. Примеры функции распределения для различных значений

коэффициентов асимметрии (а) и эксцесса (б)

 

Значения m и s используют для центрирования и нормирования случайной величины Х с помощью преобразований:

;                                                          (2.20)

,                                                 (2.21)

где величину называют центрированной, а величину - нормированной (стандартизованной ) величиной. Математические ожидания величин и будут равны нулю, а стандартное (среднеквадратическое) отклонение нормированной величины будет равно 1.

Если применить операцию нормирования (2.21) к нормально распределенной случайной величине Х: , то выражения для функции нормального закона распределения (2.9) и нормальной плотности вероятности (2.10) преобразуются к виду

,                                            (2.22)

.                                                     (2.23)

Выражение (2.22) представляет функцию нормального закона распределения нормированной случайной величины, получившей название функция Лапласа. Геометрически функция Лапласа представляет площадь под кривой j(z) в промежутке от -¥ до некоторой конкретной величины z. Значения этой функции для различных z табулированы (табл. П.1).

Функция (2.23) является плотностью вероятности нормированного нормального распределения.

 

 

 

Вероятность нахождения случайной величины Х, следующей нормальному закону распределения с параметрами m и s в интервале (-¥,х1), может быть подсчитана с использованием функции Лапласа (2.22) так:

.                                            (2.24)

Аналогичная вероятность для интервала (х12) может быть определена из выражения

.                        (2.25)

Пользуясь последними соотношениями, можно определить, что вероятность попадания нормально распределенной случайной величины в интервал составляет Р»0,68, в интервал Р»0,95, в интервал Р»0,997.

Пример. Образцы прессованного  алюминиевого профиля многократно  испытаны на разрыв с целью определения  предела прочности sв , при этом установлено, что математическое ожидание и стандартное отклонение для sв составили m=453 МПа и s=11.3 МПа. Требуется определить вероятность попадания значения предела прочности в интервал 430 - 470 МПа.

Преобразуем по (2.21) значения границ рассматриваемого интервала к нормированному виду: и .

По таблицам значений нормированной функции нормального  распределения (функции Лапласа) находим для значений z1 и z2:

Ф(z1)=Ф(-2,04)=1-Ф(2,04)= 1-0,9793=0,0207,      Ф(z2)=Ф(1,5)=0,9332.

По формуле (2.25) находим 

Проведенные расчеты  показывают, что примерно 91 % образцов этого профиля подвергнутых, испытанию  на разрыв, будут обладать значением  предела прочности в диапазоне  от 430 до 470 МПа.

 

 

 

2.3. Распределения, связанные  с нормальным

 

С нормальным или нормированным  нормальным распределением тесно связано  ряд распределений, широко применяемых  при анализе случайных величин. Основными из таких распределений являются следующие.

2.3.1. Распределение c2 (распределение Пирсона)

Если xi* , i=1,2,...,n - независимые нормированные нормально распределенные случайные величины с математическим ожиданием m=0 и дисперсией s2=1, то сумма квадратов этих величин подчиняется распределению c2 (распределению Пирсона) с числом степеней свободы n. Кривые Пирсона для различных n показаны на рис. 2.5. Существуют статистические таблицы, в которых значения функции распределения Пирсона табулированы для различных уровней значимости и числа степеней свободы (табл. П.3).

 

 

Рис. 2.5. График плотности распределения  Пирсона 

 

 

2.3.2. Распределение Стьюдента  (t - распределение)

Если U - нормированная нормально распределенная случайная величина, c2 - случайная величина, имеющая распределение Пирсона с n степенями свободы, причем U и c2 независимы, то величина  будет подчиняться t - распределению (распределению Стьюдента). Вид кривых Стьюдента в зависимости от числа степеней свободы n показан на рис. 2.6.

Рис. 2.6. График плотности  распределения Стьюдента 

 

Существуют таблицы с табулированными  значениями функции t - распределения для различных уровней значимости a и различных n , а также таблицы со значениями квантилей этого распределения (табл. П.6).

Особенностью распределения Стьюдента  является то, что при увеличении числа степеней свободы распределение Стьюдента приближается к нормированному нормальному распределению (распределению Гаусса). При n>60 принято считать, что эти два распределения сходятся.

 

2.3.3. F-распределение (распределение Фишера)

Если    и - две независимые случайные величины,  подчиненные   c2 - распределению (распределение Пирсона) с числами степеней свободы n1 и n2 соответственно, то величина подчиняется F - распределению (распределению Фишера) с n1 и n2 степенями свободы. Кривые Фишера для разного числа степеней свободы n1 при n2=¥ показаны на рис. 2.7. Существуют статистические таблицы как с табулированными значениями функции распределения Фишера для принятого уровня значимости, так и с табулированными значениями квантилей этого распределения (табл. П.4 и П.5).

 

Рис. 2.7. График плотности распределения Фишера

 

2.4. Выборки. Статистические  оценки 

 

Для подавляющего большинства экспериментально наблюдаемых случайных величин закон распределения и его числовые характеристики (s2 и m) исследователю не известны и должны быть определены по опытным данным. Строго говоря, для установления точного вида закона распределения случайной величины или определения точных значений параметров распределения необходимо произвести бесконечное число измерений.

Воображаемое, бесконечно большое  множество всех результатов испытаний, которые в принципе могут быть реализованы при данных условиях называют генеральной совокупностью.

По ГОСТ 15895-77, генеральная совокупность это множество всех рассматриваемых единиц.

Но порой даже сама постановка задачи проведения бесконечного (или очень большого) числа измерений выглядит абсурдно.

Например, для того чтобы  точно определить закон распределения  усилия осадки свинцового образца, упомянутого раньше, пришлось бы извлечь всю имеющуюся в Земле свинецсодержащую руду (или значительную ее часть), переплавить ее, превратить в образцы для лабораторных испытаний и осадить их.

На практике мы имеем возможность  провести только ограниченное число  измерений.

Ограниченную совокупность результатов  испытаний, являющуюся частью генеральной совокупности называют выборкой (рис. 2.8), а значения характеристик, вычисляемые по выборке, называют выборочными характеристиками или оценками генеральных характеристик или статистиками.

Рис. 2.8. Генеральная совокупность (1) и выборка (2)

 

По ГОСТ 15895-77, выборка - это любое конечное подмножество генеральной совокупности, предназначенное для непосредственных исследований.

Вполне естественно, что найденные  по данным выборки величины (выборочные числовые характеристики случайной величины) в большей или меньшей степени будут отличаться от аналогичных точных величин, так называемых генеральных характеристик, определенных по генеральной совокупности данных.

Генеральные числовые характеристики случайной величины являются детерминированными величинами, а выборочные, т.е. их оценки, - случайными. Эта разница генеральных и выборочных характеристик является принципиальной и определяет то, что величины, рассчитанные по выборке, являются некоторым приближением точных значений генеральных характеристик. Точность приближения зависит от количества испытаний N и местоположения опытных точек, поэтому говорят, что выборочные характеристики являются оценками неизвестных значений генеральных характеристик.

 

 

Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема (т. е. по некоторой части генеральной совокупности) высказать обоснованное суждение о свойствах генеральной совокупности в целом.

Подобное суждение получают путем  оценивания эмпирических (выборочных) аналогов вероятностных характеристик исследуемой величины, иначе говоря, путем оценивания параметров (характеристик) генеральной совокупности с помощью некоторой подходящей функции результатов наблюдений - оценок параметров распределения (обычно слова “параметров распределения” опускают).

По ГОСТ 15895-77, оценивание – это определение приближенного значения  неизвестного параметра генеральной совокупности по результатам наблюдений.

По ГОСТ 15895-77, оценкой называется статистика, являющаяся основой для оценивания неизвестного параметра распределения.

Для оценивания одного и того же параметра  распределения случайной величины можно использовать различные оценки, различные эмпирические, выборочные аналоги.

Пример. Пусть мы имеет  некоторую выборку x1, x2, x3, ... ,xN, с соответствующими значениями 6,13; 6,00; 5,96; 5,94; 5,91; 5,75; 5,69; 5,67; 5,46; 5,30.

В качестве оценки математического  ожидания могут быть рассмотрены, например, следующие величины:

среднее арифметическое                  ,

среднее по интервалу                     ,

центральный момент          ,

.

Для того чтобы выбрать наилучшие  из оценок, необходимо сформулировать некоторые требования к их свойствам, желательно с точки зрения практики.

 

Такими требованиями являются.

1. Состоятельность.

По ГОСТ 15895-77, состоятельная оценка - это оценка, сходящаяся по величине к значению оцениваемого параметра при безграничном возрастании объема выборки.

Иными словами, вероятность события, заключающегося в непревышении разницы между оценочной и генеральной характеристикам сколь угодно малой величины e, при увеличении объема выборки должна неограниченно приближаться к единице .

Состоятельность оценки гарантирует  исследователю увеличение точности оценивания с ростом N и то, что хотя бы в пределе при N®µ он может получить точное значение q.

2. Несмещенность.

По ГОСТ 15895-77, несмещенная оценка - оценка, математическое ожидание которой равно значению оцениваемого параметра.

Для несмещенной оценки характерно, что для любого N . Иными словами, несмещенность означает отсутствие систематической погрешности при оценивании параметров.

3. Эффективность.

По ГОСТ 15895-77, эффективная оценка это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.

Эффективная оценка, следовательно, имеет  минимальную случайную ошибку и в этом смысле наиболее точная.

 

 

В приведенном выше примере  состоятельной, несмещенной и эффективной оценкой является среднее арифметическое

                 

 

 

2.5. Точечные оценки 

 

По ГОСТ 15895-77, точечное оценивание - это определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений.

Точечные оценки - это оценки некоторых  неизвестных числовых характеристик закона распределения случайной величины, полученные в виде конкретного числа, точки на числовой оси.

Для случайной величины с нормальным законом распределения наилучшей оценкой величины математического ожидания m служит величина выборочного среднего арифметического, генеральной дисперсии s2 - выборочной дисперсии, а генерального среднеквадратического отклонения s – выборочное среднеквадратическое отклонение.

По ГОСТ 15895-77, выборочное среднее арифметическое - это сумма значений рассматриваемой величины, полученная по результатам испытания выборки, деленная на ее объем (количество единиц в выборке N):

.                                                             (2.26)

По ГОСТ 15895-77, выборочная дисперсия это сумма квадратов отклонений выборочных результатов наблюдений от их выборочного среднего арифметического в выборке, деленная на (N-1) или N:

.                                             (2.27)

Для нормального закона распределения случайной величины оценки (2.26) и (2.27) являются состоятельными, несмещенными и эффективными.

Информация о работе Обработка опытных данных.Статистические гипотизы и выводы