Задачи математической статистики

Автор работы: Пользователь скрыл имя, 28 Мая 2013 в 20:48, контрольная работа

Описание работы

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных и результатов наблюдений.
Первая задача математической статистики - указать: способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования.

Файлы: 1 файл

matematicheskaya_statistika.doc

— 1.19 Мб (Скачать файл)

Т.к. < - нулевую гипотезу принимаем, другими словами, различие между эмпирическими значениями и теоретическими не значимо, т.е. данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

14 Функциональная, статистическая и корреляционная зависимости

 

Во многих задачах  требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин.

Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин (под «общими» здесь подразумеваются такие факторы, которые воздействуют и на Y и на X). В этом случае возникает статистическая зависимость.

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.

Приведем пример случайной  величины Y, которая не связана с величиной X  функционально, а связана  корреляционно. Пусть Y - урожай зерна, X - количество удобрений. С одинаковых по площади участков земли при равных количествах  внесенных удобрений  снимают различный урожай, т. е. Y не является функцией от X. Это объясняется влиянием случайных факторов  (осадки, температура воздуха и др.).   Вместе с  тем, как  показывает опыт, средний урожай является функцией от количества удобрений, т. е. Y связан с X корреляционной зависимостью.

Рассмотрим две зависимые  случайные величины. Представим одну из них как функцию другой. Пусть Х связана с Y линейной зависимостью: у=a+bx, которую называют линейной регрессией.

Для расчета параметров a и b линейной регрессии решаем систему нормальных уравнений относительно a и b.

=na+b


=a +b

Для определения степени  тесноты линейной зависимости служит выборочный коэффициент корреляции.

Выборочный коэффициент корреляции может принимать значения в пределах от -1 до 1. Чем ближе он по абсолютной величине к 1, тем тесте связь. Знак при нем указывает направление связи: знак + соответствует прямой зависимости, т.е. с увеличением х увеличивается и у, знак - соответствует обратной зависимости, т.е. с увеличением х, у уменьшается.

Если r=±1, то х и у связаны линейной функциональной зависимостью. Если r=0, то величины не зависимы.

Выборочный коэффициент корреляции определяется следующим образом: rв = .

Если выборочный коэффициент корреляции найден по выборке и оказался не равен 0. Т.к. выборка отобрана случайно, то нельзя заключать, что коэффициент корреляции генеральной совокупности также отличен от 0. Возникает необходимость проверить гипотезу о значимости (существенности) выборочного  коэффициента корреляции или о равенстве нулю коэффициента корреляции генеральной совокупности.

Правило:

Для того, чтобы при  заданном уровне значимости α проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, надо вычислить наблюдаемое значение критерия: Тнабл.=rв / и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы k=n-2 найти критическую точку tкр(α, k) для двусторонней критической области.

Если |Тнабл|<tкр, нулевую гипотезу принимаем, в противном случае отвергаем.

Пример 14.1.

По следующим данным построить уравнение линейной регрессии, определить выборочный коэффициент корреляции и проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, при уровне значимости α=0,05:

Х

12

15

19

22

27

31

33

35

40

42

Y

23

28

35

41

55

52

59

55

50

51


Решение:

Составим выборочное уравнение регрессии Y на Х: у=a+bx.

Параметры уравнений найдем путем составления и решения системы уравнений:

=na+b


= a + b

Составим расчетную  таблицу:

x

y

xy

x2

y2

12

15

19

22

27

31

33

35

40

42

23

28

35

41

55

52

59

55

50

51

276

420

665

902

1485

1612

1947

1925

2000

2142

144

225

361

484

729

961

1089

1225

1600

1764

529

784

1225

1681

3025

2704

3481

3025

2500

2601

276

449

13374

8582

21555


Возьмем значения из последней  строчки таблицы.

449=10а+276b


13374=276а+8582b.

Решим систему b=1,02; а=16,81.

Составим уравнение  ух=16,81+1,02х

Вычислим выборочный коэффициент корреляции: rв= , где = ,

,

,

= »9,82,

= »11,81.

rв= »0,846.

Т.к. rв>0, то делаем вывод, что связь между признаками прямая, а т.к. rв близок к 1, то связь тесная.

При уровне значимости α=0,05 проверим нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0.

Найдем наблюдаемое  значение критерия: Тнабл.= ≈8,42.

По условию конкурирующая гипотеза имеет вид: rг≠0, поэтому критическая область – двусторонняя.

Находим критическую  точку по таблице критических точек распределения Стьюдента по уровню значимости 0,05 tкр.(0,05; 8)=2,31.

Так как Тнабл>tкр - нулевую гипотезу отвергаем, другими словами выборочный  коэффициент корреляции значимо отличается от нуля.

 

15 Решение нулевого варианта

 

Для двух заданных выборок Х и Y

1. Определим точечные оценки:

- среднюю выборочную:

= =6,915;

=1429/20»71,45;

- выборочную дисперсию

= = =3,46; 

= =7606,95/20»380,35; 

- выборочное среднее  квадратическое отклонение:

= »1,86;

= »19,5.

- исправленную дисперсию:

= = =3,64;

= =;

- исправленное среднее  квадратическое отклонение.

=

=

2. составим интервальный  ряд, число интервалов, возьмем равным 5.

R=xmax-xmin=10-3,2=6,8. m=5 – число интервалов, h=6,8/5=1,36- длина интервала.

 

 

Получаем ряд:    3,2-4,56   4,56-5,92   5,92-7,28   7,28-8,36   8,36-10 

                                  3                 3                6                 4              4

Построим гистограмму  относительных частот, для этого  определим относительные частоты Wi=ni/20, и плотность относительных частот Wi/1,36.

 

Интервал    3,2-4,56   4,56-5,92   5,92-7,28   7,28-8,36   8,36-10

 ni                    3                 3                6                 4              4

Wi                    0,15            0,15          0,3               0,2           0,2

Wi/1,36            0,11         0,11        0,22            0,15        0,15

      Wi/1,36        


         0,3


 

       0, 2



       0, 1 


 

 x


3,2      4,56      5,92     7,28        8,36        10

 

3. построить доверительные интервалы для:

математического ожидания: -t <ax< +t .

Число t определяется из равенства: 2Ф(t)=g. По таблице функции Лапласа находим аргумент t.

Пусть g=0,9 Þ 2Ф(t)=0,9; Ф(t)=0,45 Þ t=1,65.

6,915-1,65* <ax<6,915+1,65* ;          6,915-0,686<ax<6,915+0,686

  6,229<ax<7,601;

дисперсии: s2(1-q)2< < s2(1+q)2

q находим по таблице при g=0,95 и n=20: q=0,37;  = » =3,64;  – исправленная дисперсия.

3,64*(1-0,37)2< <3,64*(1+0,37)2;            1,44< <6,82.

Среднего квадратического  отклонения: s(1-q)< < s(1+q)

< х< ;      1,2< х<2,6;

4. Найдем  выборочный коэффициент корреляции и проверить его значимость;

r= = =0,047.    

проверим  значимость парного коэффициента корреляции.

При уровне значимости a=0,05 проверим нулевую гипотезу о равенстве нулю генерального коэффициента корреляции, при конкурирующей гипотезе Н1:rг¹0.

Найдем наблюдаемое значение критерия:

Тнабл=r / =0,047* / =0,199.

Т.к. альтернативная гипотеза имеет вид: rг¹0, следовательно, критическая область – двусторонняя.

По таблице критических  точек распределения Стьюдента, по уровню значимости  0,05 и числу  степеней свободы k=n-2=20-2=18 находим критическую точку tкр(0,05;18)=2,1.

Т.к. < tкр - нулевую гипотезу не отвергаем, другими словами, различие между нулем и коэффициентом корреляции, не значимо.

 

  1. проверить гипотезы:

- о нормальном законе  распределения случайной величины Х  с помощью критерия Пирсона;

Вычислим теоретические частоты,

xi- середина интервала.

Составим вспомогательную  таблицу:

ui=(хi-xв)/

 ni=nh/s* f(ui )=15,2*f(ui).  =1,283.

По таблице критических  точек распределения  , по уровню значимости  0,05 и числу степеней свободы k=m-3=5-3=2 находим критическую точку (0,05;2)=6.

Т.к. < - нулевую гипотезу не отвергаем, другими словами, различие между эмпирическими значениями и теоретическими не значимо, т.е. данные наблюдений  согласуются с гипотезой о нормальном распределении генеральной совокупности.

. О равенстве математических ожиданий заданной величине m0.

    •        При уровне значимости a=0,05 проверим нулевую гипотезу Н0: m=m0x=6,6, при конкурирующей гипотезе Н1: m¹6,6.

Найдем наблюдаемое  значение критерия:

Uнабл=( 0) / =(6,915-6,6)* /1,86=0,76.

Т.к. альтернативная гипотеза имеет вид m¹m0x, следовательно, критическая область – двусторонняя.

Находим критическую  точку  Ф(u кр )=(1-a)/2=(1-0,05)/2=0,475.

По таблице функции  Лапласа находим u кр=1,96.

Т.к. <uкр, нулевую гипотезу не отвергаем, другими словами, выборочная и гипотетическая средние различаются не значимо.

 

О равенстве  дисперсий заданной величине ( = ).

  •      При уровне значимости a=0,01 проверим нулевую гипотезу Н0: = =3,4, при конкурирующей гипотезе Н1: >3,4.

Найдем наблюдаемое  значение критерия:

=(n-1)S2/ =(20-1)*3,64/3,4=20,34.

Т.к. альтернативная гипотеза имеет вид >3,4, следовательно, критическая область – правосторонняя.

По таблице критических  точек распределения  , по уровню значимости  0,01 и числу степеней свободы k=n-1=20-1=19 находим критическую точку (0,01;19)=36,2.

Т.к. < - нулевую гипотезу не отвергаем, другими словами, различие между исправленной дисперсией и гипотетическая генеральной дисперсией не значимо.

- о равенстве дисперсий двух генеральных совокупностей Х и Y ( = );

- о равенстве математических ожиданий двух генеральных совокупностей Х и Y (mx=my).

  1. составить уравнение линейной регрессии.

 

 

16 Расчетно-графические задания

 

Для двух заданных выборок Х и Y (таблица 1):

  1. найти точечные оценки:

- среднюю выборочную,

- выборочную дисперсию, 

- выборочное среднее  квадратическое отклонение,

- исправленную дисперсию, 

- исправленное среднее  квадратическое отклонение.

  1. составить интервальный ряд, число интервалов, равно 5 и построить гистограммы частот относительных частот;
  2. построить доверительные интервалы для:

Информация о работе Задачи математической статистики