Статистическая обработка результатов испытаний одномерных и двумерных случайных величин
Курсовая работа, 16 Апреля 2014, автор: пользователь скрыл имя
Описание работы
В данной курсовой работе проводим статистическую обработку результатов испытаний для двух разных задач. В первой задаче представлены контрольные обмеры 100 валиков. Для статистической обработки строим полигон и гистограмму частот, это позволяет нам определить вид распределения. Проверяем гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона.
Содержание работы
Введение 3
Статистическая обработка 4
Одномерные случайные величины 4
Двумерные случайные величины 14
Заключение 21
Список использованной литературы 22
Файлы: 1 файл
твмс курсовая(Даша).docx
— 119.57 Кб (Скачать файл),
где n – объем выборки, вероятность
попадания нормированной случайной величины в интервал
, где Ф=. [15]
- Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
А) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия
.
Б) по таблице критических точек распределения , по заданному уровню значимости α и числу степеней свободы k=s–3 (s – число групп выборки) находят критическую точку =(α; k) правосторонней критической области.
Если < – нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются не значимо. Если > – гипотезу отвергают, т.е. эмпирические и теоретические частоты различаются значимо.
Составим расчетную таблицу, где и концы интервалов контрольных обмеров валиков, их частота, выборочную среднюю и выборочное среднее квадратическое отклонение * мы уже вычислили ранее, находим значение случайной величины Z, значение Ф(Z) нашли по таблице приложения №2, разность значений Ф() и Ф(). Уровень значимости α=0,05 и число групп выборки s=7, тогда число степеней свободы k=4. Критическая точка =(α; k)=(0,05; 4)=9,5.
Табл.№3
i |
Ф() |
Ф() |
n'=n |
(-n')2/n' | ||||||
1 |
7,13 |
7,2 |
1 |
-∞ |
-2,1977 |
-0,5 |
-0,4861 |
0,0139 |
1,39 |
|
2 |
7,2 |
7,27 |
5 |
-2,1977 |
-1,5736 |
-0,4861 |
-0,4418 |
0,0443 |
4,43 |
0,0056 |
3 |
7,27 |
7,34 |
13 |
-1,5736 |
-0,9495 |
-0,4418 |
-0,3289 |
0,1129 |
11,29 |
0,259 |
4 |
7,34 |
7,41 |
23 |
-0,9495 |
-0,3254 |
-0,3289 |
-0,1274 |
0,2015 |
20,15 |
0,4031 |
5 |
7,41 |
7,48 |
18 |
-0,3254 |
0,29867 |
-0,1274 |
0,1179 |
0,2453 |
24,53 |
1,7383 |
6 |
7,48 |
7,55 |
23 |
0,2987 |
0,92276 |
0,1179 |
0,3212 |
0,2033 |
20,33 |
0,3507 |
7 |
7,55 |
7,62 |
11 |
0,9228 |
1,54684 |
0,3212 |
0,4394 |
0,1182 |
11,82 |
0,0569 |
8 |
7,62 |
7,69 |
6 |
1,5468 |
∞ |
0,4394 |
0,5 |
0,0606 |
6,06 |
0,0006 |
100 |
1 |
2,8141 |
Из таблицы №3 находим 2,8141.
Так как =9,5, то следует, что (2,8141<9,5). Критерий Пирсона выполняется, значит, результаты контрольного обмера валиков имеют нормальное распределение.
Кривая Гаусса
Непрерывная случайная величина Х имеет нормальное распределение с параметрами а и *2, где а – выборочное среднее значение и *2 – среднее квадратическое отклонение, если плотность распределения вероятностей имеет вид f(x)= График плотности f(x) нормального распределения называется кривой Гаусса. Для построения графика используем 5 точек:
- точка максимума (а; )=(7,4465; 2,4904)
- точка перегиба (а+*; )=(7,6067; 1,5105)
- точка перегиба (а-*; )=(7,2863; 1,5105)
- вспомогательная точка (а-2*; )=(7,1260; 0,9162)
- вспомогательная точка (а+2*; )=( 7,7670; 0,9162)
Интервальные оценки
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика **служит оценкой неизвестного параметра *. Будем считать * постоянным числом (* может быть и случайной величиной). ** тем точнее определяет параметр *, чем меньше абсолютная величина разности | * – **|.
Однако статистические методы не позволяют категорически утверждать, что оценка ** удовлетворяет неравенству | * – **|<*; можно лишь говорить о вероятности *, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки * по ** называют вероятность *, с которой осуществляется неравенство | * – **|<*. Обычно надежность оценки задается наперед , причем в качестве * берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.
Пусть вероятность того, что | * – **|<*, равна *:
Р[| * – **|<*]=*.
Заменив неравенство | * – ** | < * равносильным ему двойным неравенством –*<* – **<*, или **–*< * < **+*, имеем
Р[**–*< * < **+*]=*.
Это соотношение следует понимать так: вероятность того что интервал (**–*,**+*) заключает в себе (покрывает) неизвестный параметр *, равна *.
Доверительным называют интервал (**–*; **+*) который покрывает неизвестный параметр с заданной надежностью *.
Пусть количественный признак Х генеральной совокупности имеет нормальное распределение с неизвестным средним квадратическим отклонением *. По выборке х1, x2,…,xn требуется оценить математическое ожидание а.
Рассмотрим случайную величину Т=, где Z имеет нормальное распределение N(0,1); V имеет распределение *2 с «к» степенями свободы; Т имеет распределение Стьюдента «к» степенями свободы.
В качестве Z=, V=(k-1)(S2/*2), где S – исправленное выборочное среднее квадратическое отклонение
Возьмем Т== имеет распределение Стьюдента с (к-1) степенями свободы.
Пусть S(t,n) плотность распределения Стьюдента.
Р(||<t*)=2(t,n) dt=*
Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим:
P( – t*S/<a< + t*S/)=*
Пользуясь распределением Стьюдента, нашли доверительный интервал покрывающий неизвестный параметр а с надежностью *: ( – t*S/ + t*S/ [17]
и S находятся по выборке. По таблице приложения 3 по заданным n и * можно найти t*.
В первой задаче надежность * =0,95; n=100, по таблице приложения №3 – t*=1,984, тогда находим доверительный интервал для оценки математического ожидания при неизвестном *: 7,4240<a<7,4690. Вывод: в генеральной совокупности средние размеры валиков заключены в пределах от 7,4240 до 7,4690.
Доверительный интервал для оценки среднего квадратического отклонения *.
Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение * по х1, x2,…,xn и «исправленному» выборочному среднему квадратическому отклонению S. Нужно найти доверительный интервал, покрывающий неизвестный параметр * с заданной надежностью *=Р(|σ-S|<δ)
-δ<σ-S<δ
S-δ<σ<δ+S
S(1-δ/S)<σ<(1+δ/S)S
Обозначим q=δ/S => S(1-q)<σ<S(1+q)
[18]
< ; χ=
< <
< <
Обозначим χ= имеющее распределение χ2 с (n-1) степенями свободы
Пусть ее плотность R(t,n) распределения χ2,то Р(χ1 <χ< χ2)= =>
P( < χ < )=γ=. Из этого выражения находим q.
На практике q находят из таблицы приложения №4 по заданным n и γ.
По данным таблицы интервального ряда:
По заданным надежности * =0,95 и объема n=100, по таблице приложения №4 q=0,143. Тогда доверительный интервал для оценки среднего квадратического отклонения * контрольного обмера валиков имеет вид 0,0971<*<0,1295. Вывод: в генеральной совокупности средние квадратические отклонения размеров валиков заключены в пределах (0,0971; 0,1295).
Примечание: все таблицы приложения находятся в книге «В.Е. Гмурман “Теория вероятностей и математическая статистика”» 1998 г.»
Двумерные случайные величины
Задача №2: Распределение 100 предприятий по капиталовложениям Х (млн. руб.) и выпуску продукции Y (млн. руб.) приведено в таблице:
Табл.№4
У |
Х |
||||||
12 |
17 |
22 |
27 |
32 |
37 | ||
25 |
2 |
4 |
- |
- |
- |
- |
6 |
35 |
- |
6 |
3 |
- |
- |
- |
9 |
45 |
- |
- |
6 |
45 |
4 |
- |
55 |
55 |
- |
- |
2 |
8 |
6 |
- |
16 |
65 |
- |
- |
- |
4 |
7 |
3 |
14 |
2 |
10 |
11 |
57 |
17 |
3 |
100 | |
Перейдем к условным вариантам:
где =22, =5;
=45, =10;
Табл. №5
U |
|||||||
V |
-2 |
-1 |
0 |
1 |
2 |
3 | |
-2 |
2 |
4 |
- |
- |
- |
- |
6 |
-1 |
- |
6 |
3 |
- |
- |
- |
9 |
0 |
- |
- |
6 |
45 |
4 |
- |
55 |
1 |
- |
- |
2 |
8 |
6 |
- |
16 |
2 |
- |
- |
- |
4 |
7 |
3 |
14 |
2 |
10 |
11 |
57 |
17 |
3 |
100 | |
Корреляционная зависимость:
Одному значению случайной величины Х отвечает условное математическое ожидание другой случайной величины У.
В качестве оценок условных математических ожиданий применяют условные средние, которые находят по выборке.
Условным средним называют среднее арифметическое значений Y, соответствующих при Х=х.
Условным средним называют среднее арифметическое значений Х, соответствующее при Y=y.
Условное математическое ожидание М(Y|x) является функцией от х, его оценка, т.е. условное среднее , также функция от х; обозначив эту функцию через f*(x), получим уравнение = f*(x).Это уравнение называют выборочным уравнением регрессии Y на Х; функцию f*(x) называют выборочной регрессией Y на Х, а ее график – выборочной линией регрессии Y на Х.
Аналогичное уравнение =**(у) называют выборочным уравнением регрессии Х на Y; функцию **(у) называют выборочной регрессией Х на Y, ее график – выборочной линией регрессии Х на Y.
Пусть известны результаты n независимых опытов известны пары чисел (х1, у1), (х2, у2), …, (хn, уn).
Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать в виде
=kх+b регрессии Y на Х. Угловой коэффициент прямой линии регрессии У на Х называют выборочным коэффициентом регрессии Y на Х и обозначают *ух.
Выборочное уравнение прямой линии регрессии Y на Х вида Y= *ух х+b.
Подберем параметры *ух и b так, чтобы точки (х1, у1), (х2, у2), …, (хn, уn), построенные по данным наблюдений, на плоскости хОу лежали как можно ближе к прямой линии регрессии.
Воспользуемся методом наименьших квадратов. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров.
F(*, b)=⅀(Yi-yi)2, или F(*, b)=⅀(*xi+b–yi)2
Для отыскания минимума приравниваем к нулю соответствующие частные производные:
dF/d*=2;
dF/db=2.
Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно * и b:
(⅀х2)*+(⅀x)b=⅀xy; (⅀х)*+nb=⅀y.
Решив эту систему, найдем искомые параметры:
*ху=(n⅀xy–⅀x⅀y)/(n⅀x2–(⅀x)2);
b=(⅀x2⅀y–⅀x⅀xy)/(n⅀x2–(⅀x)2).
Аналогично можно найти выборочное уравнение прямой линии регрессии Х ни Y:
=х+С, где – выборочный коэффициент регрессии Х на У.
Допустим, что получено большое число данных, среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Воспользуемся тождествами:
⅀x=n; ⅀y=n; ⅀x2=n; ⅀xy=⅀xy, пара чисел (x, y)встретилась раз.
Подставив в систему
и сократив обе части второго уравнения на n, получим