,
[13]
где n – объем выборки, вероятность
попадания нормированной случайной величины в интервал
[14]
, где Ф=.
[15]
- Сравнить эмпирические и теоретические
частоты с помощью критерия Пирсона. Для
этого:
А) составляют расчетную таблицу,
по которой находят наблюдаемое значение
критерия
. [16]
Б) по таблице критических точек
распределения , по заданному уровню
значимости α и числу степеней свободы
k=s–3 (s – число групп выборки) находят
критическую точку =(α; k) правосторонней
критической области.
Если < – нет оснований
отвергнуть гипотезу о нормальном распределении
генеральной совокупности. Другими словами,
эмпирические и теоретические частоты
различаются не значимо. Если > – гипотезу
отвергают, т.е. эмпирические и теоретические
частоты различаются значимо.
Составим расчетную таблицу,
где и концы интервалов
контрольных обмеров валиков, их частота,
выборочную среднюю и выборочное среднее
квадратическое отклонение * мы уже вычислили ранее, находим
значение случайной величины Z, значение
Ф(Z) нашли по таблице приложения №2, разность значений
Ф() и Ф(). Уровень значимости
α=0,05 и число групп выборки s=7, тогда число
степеней свободы k=4. Критическая точка =(α; k)=(0,05; 4)=9,5.
Табл.№3
i |
|
|
|
|
|
Ф() |
Ф() |
|
n'=n |
(-n')2/n' |
1 |
7,13 |
7,2 |
1 |
-∞ |
-2,1977 |
-0,5 |
-0,4861 |
0,0139 |
1,39 |
|
2 |
7,2 |
7,27 |
5 |
-2,1977 |
-1,5736 |
-0,4861 |
-0,4418 |
0,0443 |
4,43 |
0,0056 |
3 |
7,27 |
7,34 |
13 |
-1,5736 |
-0,9495 |
-0,4418 |
-0,3289 |
0,1129 |
11,29 |
0,259 |
4 |
7,34 |
7,41 |
23 |
-0,9495 |
-0,3254 |
-0,3289 |
-0,1274 |
0,2015 |
20,15 |
0,4031 |
5 |
7,41 |
7,48 |
18 |
-0,3254 |
0,29867 |
-0,1274 |
0,1179 |
0,2453 |
24,53 |
1,7383 |
6 |
7,48 |
7,55 |
23 |
0,2987 |
0,92276 |
0,1179 |
0,3212 |
0,2033 |
20,33 |
0,3507 |
7 |
7,55 |
7,62 |
11 |
0,9228 |
1,54684 |
0,3212 |
0,4394 |
0,1182 |
11,82 |
0,0569 |
8 |
7,62 |
7,69 |
6 |
1,5468 |
∞ |
0,4394 |
0,5 |
0,0606 |
6,06 |
0,0006 |
|
|
|
100 |
|
|
|
|
1 |
|
2,8141 |
Из таблицы №3 находим 2,8141.
Так как =9,5, то следует,
что (2,8141<9,5). Критерий
Пирсона выполняется, значит, результаты
контрольного обмера валиков имеют нормальное
распределение.
Кривая Гаусса
Непрерывная случайная величина
Х имеет нормальное распределение с параметрами а и *2, где а – выборочное
среднее значение и *2 – среднее квадратическое
отклонение, если плотность распределения
вероятностей имеет вид f(x)= График плотности
f(x) нормального распределения называется
кривой Гаусса. Для построения графика
используем 5 точек:
- точка максимума (а; )=(7,4465; 2,4904)
- точка перегиба (а+*; )=(7,6067; 1,5105)
- точка перегиба (а-*; )=(7,2863; 1,5105)
- вспомогательная точка (а-2*; )=(7,1260; 0,9162)
- вспомогательная точка (а+2*; )=( 7,7670; 0,9162)
Интервальные оценки
Интервальной называют оценку,
которая определяется двумя числами –
концами интервала. Интервальные оценки
позволяют установить точность и надежность
оценок.
Пусть найденная по данным выборки
статистическая характеристика **служит оценкой неизвестного
параметра *. Будем считать * постоянным числом (* может быть и случайной величиной). ** тем точнее определяет параметр *, чем меньше абсолютная величина
разности | * – **|.
Однако статистические методы
не позволяют категорически утверждать,
что оценка ** удовлетворяет неравенству
| * – **|<*; можно лишь говорить о вероятности *, с которой это неравенство
осуществляется.
Надежностью (доверительной
вероятностью) оценки * по ** называют вероятность *, с которой осуществляется неравенство
| * – **|<*. Обычно надежность оценки задается
наперед , причем в качестве * берут число, близкое к единице.
Наиболее часто задают надежность, равную
0,95; 0,99; 0,999.
Пусть вероятность того, что
| * – **|<*, равна *:
Р[| * – **|<*]=*.
Заменив неравенство | * – ** | < * равносильным ему двойным
неравенством –*<* – **<*, или **–*< * < **+*, имеем
Р[**–*< * < **+*]=*.
Это соотношение следует понимать
так: вероятность того что интервал (**–*,**+*) заключает в себе (покрывает)
неизвестный параметр *, равна *.
Доверительным называют интервал
(**–*; **+*) который покрывает неизвестный
параметр с заданной надежностью *.
Пусть количественный признак
Х генеральной совокупности имеет нормальное
распределение с неизвестным средним
квадратическим отклонением *. По выборке х1, x2,…,xn требуется
оценить математическое ожидание а.
Рассмотрим случайную величину
Т=, где Z имеет
нормальное распределение N(0,1); V имеет
распределение *2 с «к» степенями свободы; Т
имеет распределение Стьюдента «к» степенями
свободы.
В качестве Z=,
V=(k-1)(S2/*2), где S – исправленное выборочное
среднее квадратическое отклонение
Возьмем Т== имеет
распределение Стьюдента с (к-1) степенями
свободы.
Пусть S(t,n) плотность распределения
Стьюдента.
Р(||<t*)=2(t,n) dt=*
Заменив неравенство в круглых
скобках равносильным ему двойным неравенством,
получим:
P( – t*S/<a< + t*S/)=*
Пользуясь распределением Стьюдента,
нашли доверительный интервал покрывающий
неизвестный параметр а
с надежностью *: ( – t*S/ +
t*S/
[17]
и S находятся по выборке. По таблице
приложения 3 по заданным n и * можно найти t*.
В первой задаче надежность * =0,95; n=100, по таблице приложения
№3 – t*=1,984, тогда находим доверительный
интервал для оценки математического
ожидания при неизвестном *: 7,4240<a<7,4690. Вывод: в генеральной совокупности
средние размеры валиков заключены в пределах
от 7,4240 до 7,4690.
Доверительный интервал
для оценки среднего квадратического
отклонения *.
Пусть количественный признак
Х генеральной совокупности распределен
нормально. Требуется оценить неизвестное
генеральное среднее квадратическое отклонение * по х1, x2,…,xn и «исправленному»
выборочному среднему квадратическому
отклонению S. Нужно найти доверительный
интервал, покрывающий неизвестный параметр * с заданной надежностью *=Р(|σ-S|<δ)
-δ<σ-S<δ
S-δ<σ<δ+S
S(1-δ/S)<σ<(1+δ/S)S
Обозначим q=δ/S => S(1-q)<σ<S(1+q)
[18]
< ; χ=
< <
< <
Обозначим χ= имеющее распределение χ2 с (n-1) степенями
свободы
Пусть ее плотность R(t,n) распределения
χ2,то Р(χ1 <χ< χ2)= =>
P( < χ < )=γ=. Из этого выражения находим
q.
На практике q находят из таблицы
приложения №4 по заданным n и γ.
По данным таблицы интервального
ряда:
По заданным надежности * =0,95 и объема n=100, по таблице
приложения №4 q=0,143. Тогда доверительный
интервал для оценки среднего квадратического
отклонения * контрольного обмера валиков имеет вид 0,0971<*<0,1295. Вывод: в генеральной
совокупности средние квадратические
отклонения размеров валиков заключены
в пределах (0,0971; 0,1295).
Примечание: все таблицы приложения находятся
в книге «В.Е. Гмурман “Теория вероятностей
и математическая статистика”» 1998 г.»
Двумерные
случайные величины
Задача №2: Распределение 100 предприятий
по капиталовложениям Х (млн. руб.) и выпуску
продукции Y (млн. руб.) приведено в таблице:
Табл.№4
У |
Х |
|
12 |
17 |
22 |
27 |
32 |
37 |
25 |
2 |
4 |
- |
- |
- |
- |
6 |
35 |
- |
6 |
3 |
- |
- |
- |
9 |
45 |
- |
- |
6 |
45 |
4 |
- |
55 |
55 |
- |
- |
2 |
8 |
6 |
- |
16 |
65 |
- |
- |
- |
4 |
7 |
3 |
14 |
|
2 |
10 |
11 |
57 |
17 |
3 |
100 |
Перейдем к условным вариантам:
где =22, =5;
=45, =10;
Табл. №5
|
U |
|
V |
-2 |
-1 |
0 |
1 |
2 |
3 |
-2 |
2 |
4 |
- |
- |
- |
- |
6 |
-1 |
- |
6 |
3 |
- |
- |
- |
9 |
0 |
- |
- |
6 |
45 |
4 |
- |
55 |
1 |
- |
- |
2 |
8 |
6 |
- |
16 |
2 |
- |
- |
- |
4 |
7 |
3 |
14 |
|
2 |
10 |
11 |
57 |
17 |
3 |
100 |
Корреляционная зависимость:
Одному значению случайной
величины Х отвечает условное математическое
ожидание другой случайной величины У.
В качестве оценок условных
математических ожиданий применяют условные
средние, которые находят по выборке.
Условным средним называют среднее
арифметическое значений Y, соответствующих
при Х=х.
Условным средним называют среднее
арифметическое значений Х, соответствующее
при Y=y.
Условное математическое ожидание
М(Y|x) является функцией от х, его оценка,
т.е. условное среднее ,
также функция от х; обозначив
эту функцию через f*(x), получим
уравнение = f*(x).Это уравнение
называют выборочным уравнением регрессии
Y на Х; функцию f*(x) называют
выборочной регрессией Y на Х, а ее график
– выборочной линией регрессии Y на Х.
Аналогичное уравнение =**(у) называют выборочным уравнением
регрессии Х на Y; функцию **(у) называют выборочной регрессией
Х на Y, ее график – выборочной линией регрессии
Х на Y.
Пусть известны результаты n независимых
опытов известны пары чисел (х1, у1), (х2, у2), …, (хn, уn).
Найдем по данным наблюдений
выборочное уравнение прямой линии среднеквадратичной
регрессии. Для определенности будем искать
в виде
=kх+b
регрессии Y на Х. Угловой коэффициент
прямой линии регрессии У на Х называют
выборочным коэффициентом регрессии Y
на Х и обозначают *ух.
Выборочное уравнение прямой
линии регрессии Y на Х вида Y= *ух х+b.
Подберем параметры *ух и b так, чтобы точки (х1, у1), (х2, у2), …, (хn, уn), построенные
по данным наблюдений, на плоскости хОу лежали как
можно ближе к прямой линии регрессии.
Воспользуемся методом наименьших
квадратов. Так как каждое отклонение
зависит от отыскиваемых параметров, то
и сумма квадратов отклонений есть функция
F этих параметров.
F(*, b)=⅀(Yi-yi)2, или F(*, b)=⅀(*xi+b–yi)2
Для отыскания минимума приравниваем
к нулю соответствующие частные производные:
dF/d*=2;
dF/db=2.
Выполнив элементарные преобразования,
получим систему двух линейных уравнений
относительно * и b:
(⅀х2)*+(⅀x)b=⅀xy; (⅀х)*+nb=⅀y.
Решив эту систему, найдем искомые
параметры:
*ху=(n⅀xy–⅀x⅀y)/(n⅀x2–(⅀x)2);
b=(⅀x2⅀y–⅀x⅀xy)/(n⅀x2–(⅀x)2).
Аналогично можно найти выборочное
уравнение прямой линии регрессии Х ни
Y:
=х+С, где – выборочный коэффициент
регрессии Х на У.
Допустим, что получено большое
число данных, среди них есть повторяющиеся,
и они сгруппированы в виде корреляционной
таблицы. Воспользуемся тождествами:
⅀x=n; ⅀y=n; ⅀x2=n; ⅀xy=⅀xy, пара чисел (x, y)встретилась
раз.
Подставив в систему
и сократив обе части второго
уравнения на n, получим
Решив эту систему, найдем параметры и b и искомое уравнение
=х+b.
Однако более целесообразно,
введя новую величину – выборочный коэффициент
корреляции, написать уравнение регрессии
в ином виде. Найдем b из второго уравнения второй
системы: b=.
Подставив правую часть этого
равенства в уравнение =х+b, получим
=(х – ).
Найдем из первой системы коэффициент
регрессии, учитывая, что 2–
()2=*2х:
*ху==.
[19]
Умножив обе части равенства
на дробь *х/*у
*ух=. [20]
Обозначив правую часть через rв – выборочный коэффициент
корреляции
rв=. [21]