Статистическая обработка результатов испытаний одномерных и двумерных случайных величин

Автор работы: Пользователь скрыл имя, 16 Апреля 2014 в 12:28, курсовая работа

Описание работы

В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона.

Содержание работы

Введение 3
Статистическая обработка 4
Одномерные случайные величины 4
Двумерные случайные величины 14
Заключение 21
Список использованной литературы 22

Файлы: 1 файл

твмс курсовая(Даша).docx

— 119.57 Кб (Скачать файл)

,                                                                                                                      [13]

где n – объем выборки, вероятность попадания нормированной случайной величины в интервал                                                                           [14]

, где Ф=.                        [15]

  1. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

А) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия

.                                                                                      [16]

Б) по таблице критических точек распределения , по заданному уровню значимости α и числу степеней свободы k=s–3 (s – число групп выборки) находят критическую точку =(α; k) правосторонней критической области.

Если < – нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются не значимо. Если > – гипотезу отвергают, т.е. эмпирические и теоретические частоты различаются значимо.

Составим расчетную таблицу, где и концы интервалов контрольных обмеров валиков, их частота, выборочную среднюю и выборочное среднее квадратическое отклонение * мы уже вычислили ранее, находим значение случайной величины Z, значение Ф(Z) нашли по таблице приложения №2, разность значений Ф() и Ф(). Уровень значимости α=0,05 и число групп выборки s=7, тогда число степеней свободы k=4. Критическая точка =(α; k)=(0,05; 4)=9,5.

Табл.№3

i

         

Ф()

Ф()

 

n'=n

(-n')2/n'

1

7,13

7,2

1

-∞

-2,1977

-0,5

-0,4861

0,0139

1,39

 

2

7,2

7,27

5

-2,1977

-1,5736

-0,4861

-0,4418

0,0443

4,43

0,0056

3

7,27

7,34

13

-1,5736

-0,9495

-0,4418

-0,3289

0,1129

11,29

0,259

4

7,34

7,41

23

-0,9495

-0,3254

-0,3289

-0,1274

0,2015

20,15

0,4031

5

7,41

7,48

18

-0,3254

0,29867

-0,1274

0,1179

0,2453

24,53

1,7383

6

7,48

7,55

23

0,2987

0,92276

0,1179

0,3212

0,2033

20,33

0,3507

7

7,55

7,62

11

0,9228

1,54684

0,3212

0,4394

0,1182

11,82

0,0569

8

7,62

7,69

6

1,5468

0,4394

0,5

0,0606

6,06

0,0006

     

100

       

1

 

2,8141


 

Из таблицы №3 находим 2,8141.

Так как =9,5, то следует, что (2,8141<9,5). Критерий Пирсона выполняется, значит, результаты контрольного обмера валиков имеют нормальное распределение.

Кривая Гаусса

Непрерывная случайная величина Х имеет нормальное распределение с параметрами а и *2, где а – выборочное среднее значение и *2 – среднее квадратическое отклонение, если плотность распределения вероятностей имеет вид f(x)= График плотности f(x) нормального распределения называется кривой Гаусса. Для построения графика используем 5 точек:

  1. точка максимума (а; )=(7,4465; 2,4904)
  2. точка перегиба (а+*; )=(7,6067; 1,5105)
  3. точка перегиба (а-*; )=(7,2863; 1,5105)
  4. вспомогательная точка (а-2*; )=(7,1260; 0,9162)
  5. вспомогательная точка (а+2*; )=( 7,7670; 0,9162)

 

Интервальные оценки

Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика **служит оценкой неизвестного параметра *. Будем считать * постоянным числом (* может быть и случайной величиной). ** тем точнее определяет параметр *, чем меньше абсолютная величина разности | * – **|.

Однако статистические методы не позволяют категорически утверждать, что оценка ** удовлетворяет неравенству | * – **|<*; можно лишь говорить о вероятности *, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки * по ** называют вероятность *, с которой осуществляется неравенство | * – **|<*. Обычно надежность оценки задается наперед , причем в качестве * берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.

Пусть вероятность того, что | * – **|<*, равна *:

Р[| * – **|<*]=*.

Заменив   неравенство | * – ** |  < *   равносильным  ему  двойным   неравенством –*<* – **<*, или **–*< * < **+*, имеем

Р[**–*< * < **+*]=*.

Это соотношение следует понимать так: вероятность того что интервал (**–*,**+*) заключает в себе (покрывает) неизвестный параметр *, равна *.

Доверительным называют интервал (**–*; **+*) который покрывает неизвестный параметр с заданной надежностью *.

Пусть количественный признак Х генеральной совокупности имеет нормальное распределение с неизвестным средним квадратическим отклонением *. По выборке х1, x2,…,xn требуется оценить математическое ожидание а.

Рассмотрим случайную величину Т=, где Z имеет нормальное распределение N(0,1); V имеет распределение *2 с «к» степенями свободы; Т имеет распределение Стьюдента «к» степенями свободы.

В качестве Z=, V=(k-1)(S2/*2), где S – исправленное выборочное среднее квадратическое отклонение

Возьмем Т== имеет распределение Стьюдента с (к-1) степенями свободы.

Пусть S(t,n) плотность распределения Стьюдента.

Р(||<t*)=2(t,n) dt=*

Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим:

P( – t*S/<a< + t*S/)=*

Пользуясь распределением Стьюдента, нашли доверительный интервал покрывающий неизвестный параметр а с надежностью *: ( – t*S/ + t*S/          [17]

 и S находятся по выборке. По таблице приложения 3 по заданным n и * можно найти t*.

В первой задаче надежность * =0,95; n=100, по таблице приложения №3 – t*=1,984, тогда находим доверительный интервал для оценки математического ожидания при неизвестном *: 7,4240<a<7,4690. Вывод: в генеральной совокупности средние размеры валиков заключены в пределах от 7,4240 до 7,4690.

Доверительный интервал для оценки среднего квадратического отклонения *.

Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение * по х1, x2,…,xn и «исправленному» выборочному среднему квадратическому отклонению S. Нужно найти доверительный интервал, покрывающий неизвестный параметр * с заданной надежностью *=Р(|σ-S|<δ)

-δ<σ-S<δ

S-δ<σ<δ+S

S(1-δ/S)<σ<(1+δ/S)S

Обозначим q=δ/S => S(1-q)<σ<S(1+q)                                                                        [18]

 < ;  χ=

< <

< <

Обозначим χ= имеющее распределение χ2 с (n-1) степенями свободы

Пусть ее плотность R(t,n) распределения χ2,то Р(χ1 <χ< χ2)= =>

P( < χ < )=γ=. Из этого выражения находим q.

На практике q находят из таблицы приложения №4 по заданным n и γ.

По данным таблицы интервального ряда:

По заданным надежности * =0,95 и объема n=100, по таблице приложения №4 q=0,143. Тогда доверительный интервал для оценки среднего квадратического отклонения * контрольного обмера валиков имеет вид 0,0971<*<0,1295. Вывод: в генеральной совокупности средние квадратические отклонения размеров валиков заключены в пределах (0,0971; 0,1295).

Примечание: все таблицы приложения находятся в книге «В.Е. Гмурман “Теория вероятностей и математическая статистика”» 1998 г.»

 

Двумерные случайные величины

Задача №2: Распределение 100 предприятий по капиталовложениям Х (млн. руб.) и выпуску продукции Y (млн. руб.) приведено в таблице:

Табл.№4

У

Х

 

12

17

22

27

32

37

25

2

4

-

-

-

-

6

35

-

6

3

-

-

-

9

45

-

-

6

45

4

-

55

55

-

-

2

8

6

-

16

65

-

-

-

4

7

3

14

 

2

10

11

57

17

3

100


 

Перейдем к условным вариантам:

 где =22, =5;

 =45, =10;

Табл. №5

 

U

 

V

-2

-1

0

1

2

3

-2

2

4

-

-

-

-

6

-1

-

6

3

-

-

-

9

0

-

-

6

45

4

-

55

1

-

-

2

8

6

-

16

2

-

-

-

4

7

3

14

 

2

10

11

57

17

3

100


 

 

Корреляционная зависимость:

Одному значению случайной величины Х отвечает условное математическое ожидание другой случайной величины У.

В качестве оценок условных математических ожиданий применяют условные средние, которые находят по выборке.

Условным средним называют среднее арифметическое значений Y, соответствующих при Х=х.

Условным средним называют среднее арифметическое значений Х, соответствующее при Y=y.

Условное математическое ожидание М(Y|x) является функцией от х, его оценка, т.е. условное среднее , также функция от х; обозначив эту функцию через f*(x), получим уравнение  = f*(x).Это уравнение называют выборочным уравнением регрессии Y на Х; функцию f*(x) называют выборочной регрессией Y на Х, а ее график – выборочной линией регрессии Y на Х.

Аналогичное уравнение =**(у) называют выборочным уравнением регрессии Х на Y; функцию **(у) называют выборочной регрессией Х на Y, ее график – выборочной линией регрессии Х на Y.

Пусть известны результаты n независимых опытов известны пары чисел (х1, у1), (х2, у2), …, (хn, уn).

Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать в виде

=kх+b  регрессии Y на Х. Угловой коэффициент прямой линии регрессии У на Х называют выборочным коэффициентом регрессии Y на Х и обозначают *ух.

Выборочное уравнение прямой линии регрессии Y на Х  вида Y= *ух х+b.

Подберем параметры *ух и b так, чтобы точки (х1, у1), (х2, у2), …, (хn, уn), построенные по данным наблюдений, на плоскости хОу лежали как можно ближе к прямой линии регрессии.

Воспользуемся методом наименьших квадратов. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров.

F(*, b)=⅀(Yi-yi)2, или F(*, b)=⅀(*xi+b–yi)2

Для отыскания минимума приравниваем к нулю соответствующие частные производные:

dF/d*=2;

dF/db=2.

Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно * и b:

(⅀х2)*+(⅀x)b=⅀xy;   (⅀х)*+nb=⅀y.

Решив эту систему, найдем искомые параметры:

*ху=(n⅀xy–⅀x⅀y)/(n⅀x2–(⅀x)2);

b=(⅀x2⅀y–⅀x⅀xy)/(n⅀x2–(⅀x)2).

Аналогично можно найти выборочное уравнение прямой линии регрессии Х ни Y:

=х+С, где – выборочный коэффициент регрессии Х на У.

Допустим, что получено большое число данных, среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Воспользуемся тождествами:

⅀x=n;  ⅀y=n;  ⅀x2=n;  ⅀xy=⅀xy, пара чисел (x, y)встретилась раз.

Подставив в систему

   и сократив обе части второго уравнения на n, получим

 

Решив эту систему, найдем параметры и b и искомое уравнение

=х+b.

Однако более целесообразно, введя новую величину – выборочный коэффициент корреляции, написать уравнение регрессии в ином виде. Найдем b из второго уравнения второй системы: b=.

Подставив правую часть этого равенства в уравнение =х+b, получим

=(х – ).

Найдем из первой системы коэффициент регрессии, учитывая, что 2– ()2=*2х:

*ху==.                                                                                 [19]

Умножив обе части равенства на дробь *х/*у

*ух=.                                                                                                  [20]

Обозначив правую часть через rв – выборочный коэффициент корреляции

rв=.                                                                                                     [21]

Информация о работе Статистическая обработка результатов испытаний одномерных и двумерных случайных величин