Определение закона распределения вероятностей

Автор работы: Пользователь скрыл имя, 03 Марта 2013 в 08:55, курсовая работа

Описание работы

В новых экономических условиях было принято решения о переходе системы измерений в России на законодательный принцип управления. В 1993 г. были приняты Законы Российской Федерации “О стандартизации”, “О сертификации продукции и услуг”, “Об обеспечении единства измерений”.В этих Законах регламентированы организационные принципы метрологического обеспечения и государственного надзора за стандартами и средствами измерений, обязанности Госстандарта, осуществляющего государственное управление деятельностью по обеспечению единства измерений в стране с помощью его должностных лиц – государственных инспекторов.

Содержание работы

Введение
Определение закона распределения вероятностей
Проверка соответствия эмпирического распределения теоретическому распределению
Определение доверительного интервала
Заключение
Список использованных источников

Файлы: 1 файл

курсовая ОТИ.docx

— 101.42 Кб (Скачать файл)

Медиана - это такая варианта, которая делит выборку на две равные части. Она является наиболее эффективной оценкой для симметричных экспоненциальных распределений (0 <х < 0,45).

Усеченная средняя - получают путем отбрасывания по k=n*β крайних членов слева и справа в упорядоченной выборке, а затем усредняются остальные члены. Используют ее для класса распределения близких к нормальному (0,45 <χ< 0,67).

Центр размаха варьирования используется для распределений близких к равномерному и к аркосинуидальному (0,67 <χ<1).

Так как χ=0,000000407, то есть попадает в интервал (0;0,45), следовательно в качестве наиболее эффективной оценки центра распределения используем медиану. Чтобы найти значение медианы необходимо сначала определить медианный номер – NМе.

,                                                   (5)

где n – число вариант в вариационном ряду, то есть:

.                                (6)

На основании этого делаем вывод, что распределение симметрично.

 

 

  1. Определение оценок третьего центрального момента:

= -35,91                                     (7)

Центральный момент третьего порядка при симметричном распределении равен нулю, поэтому его используют для расчета коэффициента асимметрии. Так как в нашем случае он отрицателен и не стремится к нулю, делаем вывод о несимметричности распределения.


  1.  Определение коэффициента асимметрии:

Асимметрия - это свойство распределения частот.

Коэффициент асимметрии (асимметричность) характеризует смещение распределения относительно математического ожидания. Знак показателя асимметрии также имеет собственную аналитическую нагрузку:

- если рассчитанный коэффициент  положительный, то кривая распределения будет иметь правостороннюю асимметрию и между показателями центра распределения имеется соотношение  ;

- если рассчитанный коэффициент  отрицательный, следовательно, кривая распределения имеет левостороннюю асимметрию, тогда между показателями центра распределения соотношение будет  .

                                                                                              (8)

 

Результат определения коэффициента асимметрии отрицателен, кривая распределения  слегка асимметрична в левой части.

  1. Определение стандартного отклонения коэффициента асимметрии:

 

Стандартное отклонение коэффициента асимметрии равно:

,                                (9)

  1. Определение оценки симметричности распределения в соответствии с условием.


Распределение можно считать  симметричным, если выполняется условие . В Microsoft Excel определяем симметричность, используя формулу ЕСЛИ(H20<=1,5*H21; "распределение симметрично"; "распределение несимметрично"), в результате чего получаем результат «распределение симметрично».

  1. Определение эксцесса:

Эксцесс – отклонение вершины кривой распределения по вертикали относительно кривой нормального распределения

                                                 (10)

  1. Определение коэффициента эксцесса:

На практике обычно определяют показатель эксцесса (Ех) с применением центрального момента четвертого порядка. Положительный показатель эксцесса определяет островершинное распределение, а отрицательный показатель эксцесса – плосковершинное.

                                                       (11)

Показатель эксцесса, определенный в Ms Excel H5/(СТЕПЕНЬ(H4;4)-3) = -0,043, что означает плосковершинное распределение.

 

  1. Определение показателя формы.

Показатель формы распределения  связан с эксцессом функциональной зависимостью:

,                                                   (12)

 

  1. Определение числа интервалов m:


Число интервалов выборки  в Ms Excel определяется следующей функцией:

1+3,3*LOG(H1),                                                (13)

В результате вычислений мы выяснили, что имеем 9 интервалов.

  1. Определение ширины интервалов

Ширина интервалов определяется по формуле:

,                                               (14)

В Ms Excel данная формула выглядит как «=(J232-J2)/H25». Ширина интервалов по результатам вычислений равна пяти.

  1. Определение суммы частостей:

Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т.е. те или иные варианты в ряду распределения. Сумму всех частот определяет численность всей совокупности, ее объем.

Частоты, выраженные в долях  единицы или в процентах к  итогу, называются частостями. Сумма частостей равна 1 или 100%.

Сумма частостей определяется по формуле:

 

 

 

 ni

ni/n

5

0,021645022

15

0,064935065

30

0,12987013

46

0,199134199

64

0,277056277

40

0,173160173

22

0,095238095

7

0,03030303

2

0,008658009

Сумма

1


 

Таблица 2. Определение суммы частостей в MS Excel

 

  1. Определение энтропийного коэффициента

Энтропией случайной величины называется функция, заданная формулой:

H(Y) = - ∑Pj·log Pj ,                                             (16)

и характеризующая стандартное отклонение симметричного распределения. Если эта величина близка к 0, то распределение симметрично.

Энтропия может  использоваться при оценке степени  разброса значений номинального признака, однако выступать в качестве меры разброса она не может. Для того чтобы использование было правомерным, значение энтропии необходимо нормировать, т.е. поделить на величину максимальной энтропии. Обычно именно так и поступают, в качестве меры разброса используя энтропийный коэффициент.

 

  1. Определение срединных значений интервалов, построение гистограммы


Удобнее всего ряды распределения  анализировать при помощи их графического изображения, позволяющего также судить о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.

Гистограмма применяется для изображения интервального ряда. На оси абсцисс откладывают интервалы ряда, высота которых равна частотам, отложенным на оси ординат. Над осью абсцисс строятся прямоугольники, площадь которых соответствует величинам произведений интервалов на их частоты.

Гистограмма является эмпирическим аналогом графика дифференциальной функции распределения.

 

Рисунок 1. Гистограмма

  1. Подбор функции для эмпирического распределения:

Выдвигаем гипотезу о нормальном законе распределения.

 

 

 


  1. Проверка соответствия эмпирического распределения теоретическому

Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность.

Статистикой критерия Пирсона  служит величина

 
,                                              (17)

 
где p- вероятность попадания изучаемой случайной величины в j-и интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x).

При вычислении вероятности  pнужно иметь в виду, что левая граница первого интервала и правая последнего должны совпадать с границами области возможных значений случайной величины. Например, при нормальном распределении первый интервал простирается до -∞, а последний - до +∞.


Нулевую гипотезу о соответствии выборочного  распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле . величины с критическим значением χ2α, найденным по таблице Лапласа для уровня значимости α и числа степеней свободы k = e- m - 1. Здесь e- число интервалов после объединения; m - число параметров, оцениваемых по рассматриваемой выборке. Если выполняется неравенство χ≤χ2α,  
то нулевую гипотезу не отвергают. При несоблюдении указанного неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.

Недостатком критерия согласия Пирсона  является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений по критерию χдругими критериями. Особенно это необходимо при сравнительно малом объеме выборки (n ≈ 100).        

 Приведем схему применения  критерия для сопоставления двух эмпирических распределений:

 

Рисунок 2. Схема применения критерия Пирсона


Проделав необходимые  вычисления в Ms Excel составили следующую таблицу:

Qi

Qi+1

Zi

Zi+1

Ф(zi)

Ф(zi+1)

Pi

nPi

ni-nPi

(ni-nPi)^2/nPi

129

134

-2,56469

-1,94692

-0,49477

-0,47381

0,02096

4,84176

0,15824

0,005171652

134

139

-1,94692

-1,32915

-0,47381

-0,40824

0,06557

15,14667

-0,14667

0,001420252

139

144

-1,32915

-0,71137

-0,40824

-0,26115

0,14709

33,97779

-8,97779

2,372158792

144

149

-0,71137

-0,0936

-0,26115

-0,03586

0,22529

52,04199

-6,04199

0,701465166

149

154

-0,0936

0,524171

-0,03586

0,19847

0,23433

54,13023

9,86977

1,799592572

154

159

0,524171

1,141944

0,19847

0,37286

0,17439

40,28409

-0,28409

0,002003449

159

164

1,141944

1,759717

0,37286

0,4608

0,08794

20,31414

-1,31414

0,085012899

164

169

1,759717

2,377489

0,4608

0,49134

0,03054

7,05474

-0,05474

0,000424745

169

173

2,377489

2,871708

0,49134

0,49801

0,00667

1,54077

0,45923

0,136874545

Информация о работе Определение закона распределения вероятностей