Методы описательной статистики

Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа

Описание работы

В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.

Файлы: 1 файл

Курсовая.doc

— 3.02 Мб (Скачать файл)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 5.

 

Найти предельную ошибку выборки  X,Y,Z; построить доверительные интервалы для среднего при доверительной вероятности p=68%, 95%, 99,7%.

Методика решения

      Выборочное среднее значение , вычисляемое по выборке ограниченного объема n, будет отличаться от идеального «точного» значения , которое можно было бы получить для бесконечно большой выборки. Разница между выборочным средним и математическим ожиданием (генеральным средним) называется ошибкой выборки:

     Ошибка выборочного наблюдения пропорциональна стандартному отклонению и обратно пропорциональна квадратному корню из объема выборки:

Искомое значение t для заданного р находится по формуле:

Доверительный интервал для генерального среднего:

                                                         

 

     Для того чтобы  найти ошибку выборочного наблюдения, необходимо по таблице Стьюдента  найти коэффициент кратности средней ошибки и

Таблица№12 «Процентные точки распределения Стьюдента t(n,p) и нормального распределения»

n

p

0,5

0,6

0,7

0,8

0,9

0,95

0,99

0,999

5

0

0,2672

0,5594

0,9195

1,4759

2,0150

3,3649

5,8934

10

0

0,2602

0,5415

0,8791

1,3722

1,8125

2,7638

4,1437

20

0

0,2567

0,5329

0,8600

1,3253

1,7247

2,5280

3,5518

30

0

0,2556

0,5300

0,8538

1,3104

1,6973

2,4573

3,3852

40

0

0,2550

0,5286

0,8507

1,3031

1,6839

2,4233

3,3069

50

0

0,2547

0,5278

0,8489

1,2987

1,6759

2,4033

3,2614

100

0

0,2540

0,5261

0,8452

1,2901

1,6602

2,3642

3,1737

1000

0

0,2534

0,5246

0,8420

1,2824

1,6464

2,3301

3,0984

z

0

0,2533

0,5244

0,8416

1,2816

1,6449

2,3263

3,0902


 

 и   и ;

Подставляя найденные значения в формулу, найдем t(x):

 

Ошибка выборочного наблюдения (X):

     Доверительный интервал  для генерального среднего  :

 

Доверительная вероятность для  среднего X: р= 0,95

В таблице,  значению р= 0,95 соответствует t=1,6973

Ошибка выборочного наблюдения (Y):

Доверительный интервал для генерального среднего :

Ошибка выборочного наблюдения (Z):

     Доверительная вероятность  p=0,997 находится между двумя значениями, следовательно, проведем интерполяцию. Таким образом,  и и ;

Ошибка выборочного наблюдения (Z):

 

 

 

 

 

 

 

 

 

 

Задача 6.

 

     Построить доверительные  интервалы для генерального среднего  , , при доверительной вероятности p=68%, 95%,99,7% упрощенным способом: «одна/две/три сигмы».

Методика решения

    Форма распределения Стьюдента приближается к нормальному распределению при большом объеме выборки, начиная с нескольких десятков единиц. При этом погрешность от замены распределения Стьюдента нормальным распределением не превышает единиц процентов.

Таблица №13. «Процентные точки распределения Фишера для выборок равного объема: »

Вероятность

(округлено)

Вероятность

Коэффициент

доверия

Ошибка выборки

Доверительный

интервал

68%

0,682689

1,000

одна сигма

95%

0,954500

2,000

две сигмы

99,7%

0,997300

3,000

три сигмы




 

 

 

 

 

 

Таким образом, получаем приближенные границы доверительных интервалов:

а)

 

    Стандартное отклонение  выборочного среднего(X):

Доверительный интервал для генерального среднего :

б)      

Стандартное отклонение выборочного  среднего(Y):

Доверительный интервал для генерального среднего :

в)

Стандартное отклонение выборочного  среднего(Z):

Доверительный интервал для генерального среднего :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 7.

 

     При уровне значимости  %;   5%;   0,3% проверить гипотезы:

 

  • = ;
  • = ;

Методика решения

    Проверка статистических гипотез основана на использовании стандартных распределений. Изучаемый статистический показатель преобразуется к случайной величине с известным стандартным законом распределения. Затем находится вероятность, по которой находиться квантиль.

     Вероятность  принятия  ошибочного решения при проверке гипотез называют уровнем значимости.

Уровень значимости определяет, в каком проценте случаев возможна ошибка, если принять изучаемую гипотезу.

Можно считать, что область применения гипотезы соответствует доверительному интервалу, а за его пределами  находится критическая область.

     Если фактическая  статистика оказывается в критической  области, то гипотезу отвергают.  Если фактическая статистика  оказывается в области принятия  гипотезы, то гипотезу принимают  при заданном уровне значимости.

    Сравнение дисперсий – проверка гипотезы о том, можно ли считать сравнимые выборочные дисперсии и оценками одной и той же генеральной дисперсии. Используется распределение Фишера. При заданном уровне значимости должно выполняться следующее неравенство:

Проверим гипотезы = , при

а) α=32%

Найдем отношение дисперсий:

Из уравнения  следует:

p=1-0,32=0,68

Используя таблицу Фишера, найдем коэффициент кратности ошибки выборки.

 

Таблица №14 «Процентные точки распределения  Фишера выборок равного

объема: »

n

p

0,5

0,6

0,7

0,8

0,9

0,95

0,99

0,999

5

1,0

1,2692

1,6410

2,2275

3,4530

5,0503

10,967

29,752

10

1,0

1,1787

1,4061

1,7316

2,3226

2,9782

4,8491

8,7539

20

1,0

1,1216

1,2684

1,4656

1,7938

2,1242

2,9377

4,2900

30

1,0

1,0978

1,2132

1,3641

1,6065

1,8409

2,3860

3,2171

40

1,0

1,0840

1,1817

1,3076

1,5056

1,6928

2,1142

2,7268

50

1,0

1,0747

1,1608

1,2706

1,4409

1,5995

1,9490

2,4413




 

Согласно таблице  и и ;

Так как фактическая статистика оказалась в критической области, то гипотеза отвергается.

б) α=5% 

Из уравнения  имеем:

p=1 - 0,05 = 0,95

В таблице Фишера,  значению р= 0,95 соответствует t=1,8409

Проверим гипотезу:

Так как фактическая статистика оказалась в области принятия гипотезы, то гипотеза принимается.

в) α=0,3%

Из уравнения  имеем:

p=1-0,003=0,997

Из таблицы следует  и и ;

 

Проверим гипотезу:

, 3,03

Так как фактическая статистика оказалась в области принятия гипотезы, то гипотеза принимается.

1) %

 По таблице Стьюдента находим t:

При известных значениях  =38,4 и =--105,46667 проверим гипотезу:

67,06667>2,4

Гипотеза отвергается, так как  фактическая статистика больше, чем  табличное значение.

б) α=5% 

В таблице Стьюдента,  значению р= 0,95 соответствует t=1,6973

67,06667>8,58

Гипотеза отвергается, так как  фактическая статистика больше, чем  табличное значение.

в) α=0,3%

 и   и ;

67,06667>16,08

Гипотеза отвергается, так как  фактическая статистика больше, чем  табличное значение.

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 8.

 

     Вычислить линейные  коэффициенты корреляции  и . Сделать вывод о тесноте линейной связи между признаками.

Методика решения

    Линейный коэффициент корреляции вычисляется следующим образом:

Коэффициент корреляции принимает  значение в диапазоне:

-1

     Знаки коэффициента корреляции и коэффициента регрессии совпадают. Знак говорит о направлении зависимости – положительной (прямой) или отрицательной (обратной).

      Величина коэффициента  корреляции говорит о тесноте  связи:

  • =1 – функциональная связь, все точки лежат на прямой линии;
  • < <1 – линейная зависимость на фоне случайных отклонений;
  • <0,3 – слабая, несущественная линейная зависимость;
  • >0,7 – существенная линейная зависимость;
  • =0 – линейная взаимосвязь отсутствует, либо взаимосвязь не заметна на фоне случайных отклонений, либо связь есть, но она существенно нелинейна.

Составим дополнительную таблицу:

                                                                                                                       Таблица №12.

X

Y

Z

XY

XZ

29

-82

28

-2378

812

31

-86

45

-2666

1395

32

-89

-38

-2848

-1216

33

-93

57

-3069

1881

32

-88

-26

-2816

-832

35

-92

-26

-3220

-910

33

-89

49

-2937

1617

29

-87

-38

-2523

-1102

35

-93

14

-3255

490

37

-98

-51

-3626

-1887

36

-97

-25

-3492

-900

38

-97

10

-3686

380

39

-100

-27

-3900

-1053

35

-105

-62

-3675

-2170

39

-100

-16

-3900

-624

39

-101

-30

-3939

-1170

41

-111

-88

-4551

-3608

41

-108

-46

-4428

-1886

41

-109

-23

-4469

-943

41

-118

-26

-4838

-1066

40

-120

-90

-4800

-3600

40

-107

31

-4280

1240

41

-117

11

-4797

451

45

-127

10

-5715

450

45

-125

-27

-5625

-1215

43

-120

-25

-5160

-1075

47

-126

-30

-5922

-1410

47

-128

31

-6016

1457

43

-125

38

-5375

1634

45

-126

-16

-5670

-720

Информация о работе Методы описательной статистики