Автор работы: Пользователь скрыл имя, 28 Мая 2013 в 20:48, контрольная работа
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных и результатов наблюдений.
Первая задача математической статистики - указать: способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования.
Т.к. < - нулевую гипотезу принимаем, другими словами, различие между эмпирическими значениями и теоретическими не значимо, т.е. данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.
14 Функциональная, статистическая и корреляционная зависимости
Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин.
Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин (под «общими» здесь подразумеваются такие факторы, которые воздействуют и на Y и на X). В этом случае возникает статистическая зависимость.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.
Приведем пример случайной величины Y, которая не связана с величиной X функционально, а связана корреляционно. Пусть Y - урожай зерна, X - количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т. е. Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает опыт, средний урожай является функцией от количества удобрений, т. е. Y связан с X корреляционной зависимостью.
Рассмотрим две зависимые случайные величины. Представим одну из них как функцию другой. Пусть Х связана с Y линейной зависимостью: у=a+bx, которую называют линейной регрессией.
Для расчета параметров a и b линейной регрессии решаем систему нормальных уравнений относительно a и b.
=na+b
=a +b
Для определения степени тесноты линейной зависимости служит выборочный коэффициент корреляции.
Выборочный коэффициент корреляции может принимать значения в пределах от -1 до 1. Чем ближе он по абсолютной величине к 1, тем тесте связь. Знак при нем указывает направление связи: знак + соответствует прямой зависимости, т.е. с увеличением х увеличивается и у, знак - соответствует обратной зависимости, т.е. с увеличением х, у уменьшается.
Если r=±1, то х и у связаны линейной функциональной зависимостью. Если r=0, то величины не зависимы.
Выборочный коэффициент корреляции определяется следующим образом: rв = .
Если выборочный коэффициент корреляции найден по выборке и оказался не равен 0. Т.к. выборка отобрана случайно, то нельзя заключать, что коэффициент корреляции генеральной совокупности также отличен от 0. Возникает необходимость проверить гипотезу о значимости (существенности) выборочного коэффициента корреляции или о равенстве нулю коэффициента корреляции генеральной совокупности.
Правило:
Для того, чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, надо вычислить наблюдаемое значение критерия: Тнабл.=rв / и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы k=n-2 найти критическую точку tкр(α, k) для двусторонней критической области.
Если |Тнабл|<tкр, нулевую гипотезу принимаем, в противном случае отвергаем.
Пример 14.1.
По следующим данным построить уравнение линейной регрессии, определить выборочный коэффициент корреляции и проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, при уровне значимости α=0,05:
Х |
12 |
15 |
19 |
22 |
27 |
31 |
33 |
35 |
40 |
42 |
Y |
23 |
28 |
35 |
41 |
55 |
52 |
59 |
55 |
50 |
51 |
Решение:
Составим выборочное уравнение регрессии Y на Х: у=a+bx.
Параметры уравнений найдем путем составления и решения системы уравнений:
=na+b
= a + b
Составим расчетную таблицу:
x |
y |
xy |
x2 |
y2 |
12 15 19 22 27 31 33 35 40 42 |
23 28 35 41 55 52 59 55 50 51 |
276 420 665 902 1485 1612 1947 1925 2000 2142 |
144 225 361 484 729 961 1089 1225 1600 1764 |
529 784 1225 1681 3025 2704 3481 3025 2500 2601 |
276 |
449 |
13374 |
8582 |
21555 |
Возьмем значения из последней строчки таблицы.
449=10а+276b
13374=276а+8582b.
Решим систему b=1,02; а=16,81.
Составим уравнение ух=16,81+1,02х
Вычислим выборочный коэффициент корреляции: rв= , где = ,
,
,
= »9,82,
= »11,81.
rв= »0,846.
Т.к. rв>0, то делаем вывод, что связь между признаками прямая, а т.к. rв близок к 1, то связь тесная.
При уровне значимости α=0,05 проверим нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0.
Найдем наблюдаемое значение критерия: Тнабл.= ≈8,42.
По условию конкурирующая гипотеза имеет вид: rг≠0, поэтому критическая область – двусторонняя.
Находим критическую точку по таблице критических точек распределения Стьюдента по уровню значимости 0,05 tкр.(0,05; 8)=2,31.
Так как Тнабл>tкр - нулевую гипотезу отвергаем, другими словами выборочный коэффициент корреляции значимо отличается от нуля.
15 Решение нулевого варианта
Для двух заданных выборок Х и Y
1. Определим точечные оценки:
- среднюю выборочную:
= =6,915;
=1429/20»71,45;
- выборочную дисперсию
= = =3,46;
= =7606,95/20»380,35;
- выборочное среднее квадратическое отклонение:
= »1,86;
= »19,5.
- исправленную дисперсию:
= = =3,64;
= =;
- исправленное среднее квадратическое отклонение.
=
=
2. составим интервальный ряд, число интервалов, возьмем равным 5.
R=xmax-xmin=10-3,2=6,8. m=5 – число интервалов, h=6,8/5=1,36- длина интервала.
Получаем ряд: 3,2-4,56 4,56-5,92 5,92-7,28 7,28-8,36 8,36-10
Построим гистограмму
относительных частот, для этого
определим относительные
Интервал 3,2-4,56 4,56-5,92 5,92-7,28 7,28-8,36 8,36-10
ni 3 3 6 4 4
Wi 0,15 0,15 0,3 0,2 0,2
Wi/1,36 0,11 0,11 0,22 0,15 0,15
Wi/1,36
0,3
0, 2
0, 1
x
3,2 4,56 5,92 7,28 8,36 10
3. построить доверительные интервалы для:
математического ожидания: -t <ax< +t .
Число t определяется из равенства: 2Ф(t)=g. По таблице функции Лапласа находим аргумент t.
Пусть g=0,9 Þ 2Ф(t)=0,9; Ф(t)=0,45 Þ t=1,65.
6,915-1,65* <ax<6,915+1,65* ; 6,915-0,686<ax<6,915+0,686
6,229<ax<7,601;
дисперсии: s2(1-q)2< < s2(1+q)2
q находим по таблице при g=0,95 и n=20: q=0,37; = » =3,64; – исправленная дисперсия.
3,64*(1-0,37)2< <3,64*(1+0,37)2; 1,44< <6,82.
Среднего квадратического отклонения: s(1-q)< < s(1+q)
< х< ; 1,2< х<2,6;
4. Найдем выборочный коэффициент корреляции и проверить его значимость;
r= = =0,047.
проверим значимость парного коэффициента корреляции.
При уровне значимости a=0,05 проверим нулевую гипотезу о равенстве нулю генерального коэффициента корреляции, при конкурирующей гипотезе Н1:rг¹0.
Найдем наблюдаемое значение критерия:
Тнабл=r / =0,047* / =0,199.
Т.к. альтернативная гипотеза имеет вид: rг¹0, следовательно, критическая область – двусторонняя.
По таблице критических точек распределения Стьюдента, по уровню значимости 0,05 и числу степеней свободы k=n-2=20-2=18 находим критическую точку tкр(0,05;18)=2,1.
Т.к. < tкр - нулевую гипотезу не отвергаем, другими словами, различие между нулем и коэффициентом корреляции, не значимо.
- о нормальном законе
распределения случайной
Вычислим теоретические частоты,
xi- середина интервала.
Составим вспомогательную таблицу:
ui=(хi-xв)/
ni’=nh/s* f(ui )=15,2*f(ui). =1,283.
По таблице критических точек распределения , по уровню значимости 0,05 и числу степеней свободы k=m-3=5-3=2 находим критическую точку (0,05;2)=6.
Т.к. < - нулевую гипотезу не отвергаем, другими словами, различие между эмпирическими значениями и теоретическими не значимо, т.е. данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.
. О равенстве математических ожиданий заданной величине m0.
Найдем наблюдаемое значение критерия:
Uнабл=( -а0) / =(6,915-6,6)* /1,86=0,76.
Т.к. альтернативная гипотеза имеет вид m¹m0x, следовательно, критическая область – двусторонняя.
Находим критическую точку Ф(u кр )=(1-a)/2=(1-0,05)/2=0,475.
По таблице функции Лапласа находим u кр=1,96.
Т.к. <uкр, нулевую гипотезу не отвергаем, другими словами, выборочная и гипотетическая средние различаются не значимо.
О равенстве дисперсий заданной величине ( = ).
Найдем наблюдаемое значение критерия:
=(n-1)S2/ =(20-1)*3,64/3,4=20,34.
Т.к. альтернативная гипотеза имеет вид >3,4, следовательно, критическая область – правосторонняя.
По таблице критических точек распределения , по уровню значимости 0,01 и числу степеней свободы k=n-1=20-1=19 находим критическую точку (0,01;19)=36,2.
Т.к. < - нулевую гипотезу не отвергаем, другими словами, различие между исправленной дисперсией и гипотетическая генеральной дисперсией не значимо.
- о равенстве дисперсий двух генеральных совокупностей Х и Y ( = );
- о равенстве математических ожиданий двух генеральных совокупностей Х и Y (mx=my).
16 Расчетно-графические задания
Для двух заданных выборок Х и Y (таблица 1):
- среднюю выборочную,
- выборочную дисперсию,
- выборочное среднее квадратическое отклонение,
- исправленную дисперсию,
- исправленное среднее квадратическое отклонение.