Статистическая обработка результатов испытаний одномерных и двумерных случайных величин

Автор работы: Пользователь скрыл имя, 16 Апреля 2014 в 12:28, курсовая работа

Описание работы

В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона.

Содержание работы

Введение 3
Статистическая обработка 4
Одномерные случайные величины 4
Двумерные случайные величины 14
Заключение 21
Список использованной литературы 22

Скачать архив (114.77 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

твмс курсовая(Даша).docx

— 119.57 Кб (Скачать файл)

, [13]

где n – объем выборки, вероятность попадания нормированной случайной величины в интервал [14]

, где Ф=. [15]

Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

А) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия

. [16]

Б) по таблице критических точек распределения , по заданному уровню значимости α и числу степеней свободы k=s–3 (s – число групп выборки) находят критическую точку =(α; k) правосторонней критической области.

Если < – нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются не значимо. Если > – гипотезу отвергают, т.е. эмпирические и теоретические частоты различаются значимо.

Составим расчетную таблицу, где и концы интервалов контрольных обмеров валиков, их частота, выборочную среднюю и выборочное среднее квадратическое отклонение * мы уже вычислили ранее, находим значение случайной величины Z, значение Ф(Z) нашли по таблице приложения №2, разность значений Ф() и Ф(). Уровень значимости α=0,05 и число групп выборки s=7, тогда число степеней свободы k=4. Критическая точка =(α; k)=(0,05; 4)=9,5.

Табл.№3

i						Ф()	Ф()		n'=n	(-n')2/n'
1	7,13	7,2	1	-∞	-2,1977	-0,5	-0,4861	0,0139	1,39
2	7,2	7,27	5	-2,1977	-1,5736	-0,4861	-0,4418	0,0443	4,43	0,0056
3	7,27	7,34	13	-1,5736	-0,9495	-0,4418	-0,3289	0,1129	11,29	0,259
4	7,34	7,41	23	-0,9495	-0,3254	-0,3289	-0,1274	0,2015	20,15	0,4031
5	7,41	7,48	18	-0,3254	0,29867	-0,1274	0,1179	0,2453	24,53	1,7383
6	7,48	7,55	23	0,2987	0,92276	0,1179	0,3212	0,2033	20,33	0,3507
7	7,55	7,62	11	0,9228	1,54684	0,3212	0,4394	0,1182	11,82	0,0569
8	7,62	7,69	6	1,5468	∞	0,4394	0,5	0,0606	6,06	0,0006
			100					1		2,8141

Из таблицы №3 находим 2,8141.

Так как =9,5, то следует, что (2,8141<9,5). Критерий Пирсона выполняется, значит, результаты контрольного обмера валиков имеют нормальное распределение.

Кривая Гаусса

Непрерывная случайная величина Х имеет нормальное распределение с параметрами а и 2, где а – выборочное среднее значение и 2 – среднее квадратическое отклонение, если плотность распределения вероятностей имеет вид f(x)= График плотности f(x) нормального распределения называется кривой Гаусса. Для построения графика используем 5 точек:

точка максимума (а; )=(7,4465; 2,4904)
точка перегиба (а+*; )=(7,6067; 1,5105)
точка перегиба (а-*; )=(7,2863; 1,5105)
вспомогательная точка (а-2*; )=(7,1260; 0,9162)
вспомогательная точка (а+2*; )=( 7,7670; 0,9162)

Интервальные оценки

Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика **служит оценкой неизвестного параметра . Будем считать постоянным числом (* может быть и случайной величиной). ** тем точнее определяет параметр , чем меньше абсолютная величина разности | – **|.

Однако статистические методы не позволяют категорически утверждать, что оценка ** удовлетворяет неравенству | * – **|<; можно лишь говорить о вероятности , с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки * по ** называют вероятность , с которой осуществляется неравенство | – **|<. Обычно надежность оценки задается наперед , причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.

Пусть вероятность того, что | * – **|<, равна :

Р[| * – **|<]=.

Заменив неравенство | * – ** | < * равносильным ему двойным неравенством –< – **<*, или **–< < **+*, имеем

Р[**–< < **+]=.

Это соотношение следует понимать так: вероятность того что интервал (**–*,**+) заключает в себе (покрывает) неизвестный параметр , равна *.

Доверительным называют интервал (**–*; **+) который покрывает неизвестный параметр с заданной надежностью .

Пусть количественный признак Х генеральной совокупности имеет нормальное распределение с неизвестным средним квадратическим отклонением *. По выборке х1, x2,…,xn требуется оценить математическое ожидание а.

Рассмотрим случайную величину Т=, где Z имеет нормальное распределение N(0,1); V имеет распределение *2 с «к» степенями свободы; Т имеет распределение Стьюдента «к» степенями свободы.

В качестве Z=, V=(k-1)(S2/*2), где S – исправленное выборочное среднее квадратическое отклонение

Возьмем Т== имеет распределение Стьюдента с (к-1) степенями свободы.

Пусть S(t,n) плотность распределения Стьюдента.

Р(||<t)=2(t,n) dt=

Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим:

P( – tS/<a< + tS/)=*

Пользуясь распределением Стьюдента, нашли доверительный интервал покрывающий неизвестный параметр а с надежностью : ( – tS/ + t*S/ [17]

и S находятся по выборке. По таблице приложения 3 по заданным n и * можно найти t*.

В первой задаче надежность * =0,95; n=100, по таблице приложения №3 – t=1,984, тогда находим доверительный интервал для оценки математического ожидания при неизвестном : 7,4240<a<7,4690. Вывод: в генеральной совокупности средние размеры валиков заключены в пределах от 7,4240 до 7,4690.

Доверительный интервал для оценки среднего квадратического отклонения *.

Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение * по х1, x2,…,xn и «исправленному» выборочному среднему квадратическому отклонению S. Нужно найти доверительный интервал, покрывающий неизвестный параметр * с заданной надежностью *=Р(|σ-S|<δ)

-δ<σ-S<δ

S-δ<σ<δ+S

S(1-δ/S)<σ<(1+δ/S)S

Обозначим q=δ/S => S(1-q)<σ<S(1+q) [18]

< ; χ=

< <

Обозначим χ= имеющее распределение χ2 с (n-1) степенями свободы

Пусть ее плотность R(t,n) распределения χ2,то Р(χ1 <χ< χ2)= =>

P( < χ < )=γ=. Из этого выражения находим q.

На практике q находят из таблицы приложения №4 по заданным n и γ.

По данным таблицы интервального ряда:

По заданным надежности * =0,95 и объема n=100, по таблице приложения №4 q=0,143. Тогда доверительный интервал для оценки среднего квадратического отклонения * контрольного обмера валиков имеет вид 0,0971<*<0,1295. Вывод: в генеральной совокупности средние квадратические отклонения размеров валиков заключены в пределах (0,0971; 0,1295).

Примечание: все таблицы приложения находятся в книге «В.Е. Гмурман “Теория вероятностей и математическая статистика”» 1998 г.»

Двумерные случайные величины

Задача №2: Распределение 100 предприятий по капиталовложениям Х (млн. руб.) и выпуску продукции Y (млн. руб.) приведено в таблице:

Табл.№4

У	Х
У	12	17	22	27	32	37
25	2	4	-	-	-	-	6
35	-	6	3	-	-	-	9
45	-	-	6	45	4	-	55
55	-	-	2	8	6	-	16
65	-	-	-	4	7	3	14
	2	10	11	57	17	3	100

Перейдем к условным вариантам:

где =22, =5;

=45, =10;

Табл. №5

	U
V	-2	-1	0	1	2	3
-2	2	4	-	-	-	-	6
-1	-	6	3	-	-	-	9
0	-	-	6	45	4	-	55
1	-	-	2	8	6	-	16
2	-	-	-	4	7	3	14
	2	10	11	57	17	3	100

Корреляционная зависимость:

Одному значению случайной величины Х отвечает условное математическое ожидание другой случайной величины У.

В качестве оценок условных математических ожиданий применяют условные средние, которые находят по выборке.

Условным средним называют среднее арифметическое значений Y, соответствующих при Х=х.

Условным средним называют среднее арифметическое значений Х, соответствующее при Y=y.

Условное математическое ожидание М(Y|x) является функцией от х, его оценка, т.е. условное среднее , также функция от х; обозначив эту функцию через f(x), получим уравнение = f(x).Это уравнение называют выборочным уравнением регрессии Y на Х; функцию f*(x) называют выборочной регрессией Y на Х, а ее график – выборочной линией регрессии Y на Х.

Аналогичное уравнение =(у) называют выборочным уравнением регрессии Х на Y; функцию (у) называют выборочной регрессией Х на Y, ее график – выборочной линией регрессии Х на Y.

Пусть известны результаты n независимых опытов известны пары чисел (х1, у1), (х2, у2), …, (хn, уn).

Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать в виде

=kх+b регрессии Y на Х. Угловой коэффициент прямой линии регрессии У на Х называют выборочным коэффициентом регрессии Y на Х и обозначают *ух.

Выборочное уравнение прямой линии регрессии Y на Х вида Y= *ух х+b.

Подберем параметры *ух и b так, чтобы точки (х1, у1), (х2, у2), …, (хn, уn), построенные по данным наблюдений, на плоскости хОу лежали как можно ближе к прямой линии регрессии.

Воспользуемся методом наименьших квадратов. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров.

F(, b)=⅀(Yi-yi)2, или F(, b)=⅀(*xi+b–yi)2

Для отыскания минимума приравниваем к нулю соответствующие частные производные:

dF/d*=2;

dF/db=2.

Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно * и b:

(⅀х2)+(⅀x)b=⅀xy; (⅀х)+nb=⅀y.

Решив эту систему, найдем искомые параметры:

*ху=(n⅀xy–⅀x⅀y)/(n⅀x2–(⅀x)2);

b=(⅀x2⅀y–⅀x⅀xy)/(n⅀x2–(⅀x)2).

Аналогично можно найти выборочное уравнение прямой линии регрессии Х ни Y:

=х+С, где – выборочный коэффициент регрессии Х на У.

Допустим, что получено большое число данных, среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Воспользуемся тождествами:

⅀x=n; ⅀y=n; ⅀x2=n; ⅀xy=⅀xy, пара чисел (x, y)встретилась раз.

Подставив в систему

и сократив обе части второго уравнения на n, получим

Решив эту систему, найдем параметры и b и искомое уравнение

=х+b.

Однако более целесообразно, введя новую величину – выборочный коэффициент корреляции, написать уравнение регрессии в ином виде. Найдем b из второго уравнения второй системы: b=.

Подставив правую часть этого равенства в уравнение =х+b, получим

=(х – ).

Найдем из первой системы коэффициент регрессии, учитывая, что 2– ()2=*2х:

*ху==. [19]

Умножив обе части равенства на дробь х/у

*ух=. [20]

Обозначив правую часть через rв – выборочный коэффициент корреляции

rв=. [21]

Информация о работе Статистическая обработка результатов испытаний одномерных и двумерных случайных величин

У	Х
У	12	17	22	27	32	37
25	2	4	-	-	-	-	6
35	-	6	3	-	-	-	9
45	-	-	6	45	4	-	55
55	-	-	2	8	6	-	16
65	-	-	-	4	7	3	14
	2	10	11	57	17	3	100

	U
V	-2	-1	0	1	2	3
-2	2	4	-	-	-	-	6
-1	-	6	3	-	-	-	9
0	-	-	6	45	4	-	55
1	-	-	2	8	6	-	16
2	-	-	-	4	7	3	14
	2	10	11	57	17	3	100

У	Х
У	12	17	22	27	32	37
25	2	4	-	-	-	-	6
35	-	6	3	-	-	-	9
45	-	-	6	45	4	-	55
55	-	-	2	8	6	-	16
65	-	-	-	4	7	3	14
	2	10	11	57	17	3	100

	U
V	-2	-1	0	1	2	3
-2	2	4	-	-	-	-	6
-1	-	6	3	-	-	-	9
0	-	-	6	45	4	-	55
1	-	-	2	8	6	-	16
2	-	-	-	4	7	3	14
	2	10	11	57	17	3	100