Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа
В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.
Задача 5.
Найти предельную ошибку выборки X,Y,Z; построить доверительные интервалы для среднего при доверительной вероятности p=68%, 95%, 99,7%.
Методика решения
Выборочное среднее значение , вычисляемое по выборке ограниченного объема n, будет отличаться от идеального «точного» значения , которое можно было бы получить для бесконечно большой выборки. Разница между выборочным средним и математическим ожиданием (генеральным средним) называется ошибкой выборки:
Ошибка выборочного наблюдения пропорциональна стандартному отклонению и обратно пропорциональна квадратному корню из объема выборки:
Искомое значение t для заданного р находится по формуле:
Доверительный интервал для генерального среднего:
Для того чтобы
найти ошибку выборочного
Таблица№12 «Процентные точки распределения Стьюдента t(n,p) и нормального распределения»
n |
p | |||||||
0,5 |
0,6 |
0,7 |
0,8 |
0,9 |
0,95 |
0,99 |
0,999 | |
5 |
0 |
0,2672 |
0,5594 |
0,9195 |
1,4759 |
2,0150 |
3,3649 |
5,8934 |
10 |
0 |
0,2602 |
0,5415 |
0,8791 |
1,3722 |
1,8125 |
2,7638 |
4,1437 |
20 |
0 |
0,2567 |
0,5329 |
0,8600 |
1,3253 |
1,7247 |
2,5280 |
3,5518 |
30 |
0 |
0,2556 |
0,5300 |
0,8538 |
1,3104 |
1,6973 |
2,4573 |
3,3852 |
40 |
0 |
0,2550 |
0,5286 |
0,8507 |
1,3031 |
1,6839 |
2,4233 |
3,3069 |
50 |
0 |
0,2547 |
0,5278 |
0,8489 |
1,2987 |
1,6759 |
2,4033 |
3,2614 |
100 |
0 |
0,2540 |
0,5261 |
0,8452 |
1,2901 |
1,6602 |
2,3642 |
3,1737 |
1000 |
0 |
0,2534 |
0,5246 |
0,8420 |
1,2824 |
1,6464 |
2,3301 |
3,0984 |
z |
0 |
0,2533 |
0,5244 |
0,8416 |
1,2816 |
1,6449 |
2,3263 |
3,0902 |
и ; и ;
Подставляя найденные значения в формулу, найдем t(x):
Ошибка выборочного наблюдения (X):
Доверительный интервал для генерального среднего :
Доверительная вероятность для среднего X: р= 0,95
В таблице, значению р= 0,95 соответствует t=1,6973
Ошибка выборочного наблюдения (Y):
Доверительный интервал для генерального среднего :
Ошибка выборочного наблюдения (Z):
Доверительная вероятность p=0,997 находится между двумя значениями, следовательно, проведем интерполяцию. Таким образом, и ; и ;
Ошибка выборочного наблюдения (Z):
Задача 6.
Построить доверительные
интервалы для генерального
Методика решения
Форма распределения Стьюдента приближается к нормальному распределению при большом объеме выборки, начиная с нескольких десятков единиц. При этом погрешность от замены распределения Стьюдента нормальным распределением не превышает единиц процентов.
Таблица №13. «Процентные точки распределения Фишера для выборок равного объема: »
Вероятность (округлено) |
Вероятность |
Коэффициент доверия |
Ошибка выборки |
Доверительный интервал |
68% |
0,682689 |
1,000 |
одна сигма |
|
95% |
0,954500 |
2,000 |
две сигмы |
|
99,7% |
0,997300 |
3,000 |
три сигмы |
Таким образом, получаем приближенные
границы доверительных
а)
Стандартное отклонение выборочного среднего(X):
Доверительный интервал для генерального среднего :
б)
Стандартное отклонение выборочного среднего(Y):
Доверительный интервал для генерального среднего :
в)
Стандартное отклонение выборочного среднего(Z):
Доверительный интервал для генерального среднего :
Задача 7.
При уровне значимости %; 5%; 0,3% проверить гипотезы:
Методика решения
Проверка статистических гипотез основана на использовании стандартных распределений. Изучаемый статистический показатель преобразуется к случайной величине с известным стандартным законом распределения. Затем находится вероятность, по которой находиться квантиль.
Вероятность принятия ошибочного решения при проверке гипотез называют уровнем значимости.
Уровень значимости определяет, в каком проценте случаев возможна ошибка, если принять изучаемую гипотезу.
Можно считать, что область применения гипотезы соответствует доверительному интервалу, а за его пределами находится критическая область.
Если фактическая
статистика оказывается в
Сравнение дисперсий – проверка гипотезы о том, можно ли считать сравнимые выборочные дисперсии и оценками одной и той же генеральной дисперсии. Используется распределение Фишера. При заданном уровне значимости должно выполняться следующее неравенство:
Проверим гипотезы = , при
а) α=32%
Найдем отношение дисперсий:
Из уравнения следует:
p=1-0,32=0,68
Используя таблицу Фишера, найдем коэффициент кратности ошибки выборки.
Таблица №14 «Процентные точки
объема: »
n |
p | |||||||
0,5 |
0,6 |
0,7 |
0,8 |
0,9 |
0,95 |
0,99 |
0,999 | |
5 |
1,0 |
1,2692 |
1,6410 |
2,2275 |
3,4530 |
5,0503 |
10,967 |
29,752 |
10 |
1,0 |
1,1787 |
1,4061 |
1,7316 |
2,3226 |
2,9782 |
4,8491 |
8,7539 |
20 |
1,0 |
1,1216 |
1,2684 |
1,4656 |
1,7938 |
2,1242 |
2,9377 |
4,2900 |
30 |
1,0 |
1,0978 |
1,2132 |
1,3641 |
1,6065 |
1,8409 |
2,3860 |
3,2171 |
40 |
1,0 |
1,0840 |
1,1817 |
1,3076 |
1,5056 |
1,6928 |
2,1142 |
2,7268 |
50 |
1,0 |
1,0747 |
1,1608 |
1,2706 |
1,4409 |
1,5995 |
1,9490 |
2,4413 |
Согласно таблице и ; и ;
Так как фактическая статистика оказалась в критической области, то гипотеза отвергается.
б) α=5%
Из уравнения имеем:
p=1 - 0,05 = 0,95
В таблице Фишера, значению р= 0,95 соответствует t=1,8409
Проверим гипотезу:
Так как фактическая статистика оказалась в области принятия гипотезы, то гипотеза принимается.
в) α=0,3%
Из уравнения имеем:
p=1-0,003=0,997
Из таблицы следует и ; и ;
Проверим гипотезу:
, 3,03
Так как фактическая статистика оказалась в области принятия гипотезы, то гипотеза принимается.
1) %
По таблице Стьюдента находим t:
При известных значениях =38,4 и =--105,46667 проверим гипотезу:
67,06667>2,4
Гипотеза отвергается, так как фактическая статистика больше, чем табличное значение.
б) α=5%
В таблице Стьюдента, значению р= 0,95 соответствует t=1,6973
67,06667>8,58
Гипотеза отвергается, так как фактическая статистика больше, чем табличное значение.
в) α=0,3%
и ; и ;
67,06667>16,08
Гипотеза отвергается, так как фактическая статистика больше, чем табличное значение.
Задача 8.
Вычислить линейные коэффициенты корреляции и . Сделать вывод о тесноте линейной связи между признаками.
Методика решения
Линейный коэффициент корреляции вычисляется следующим образом:
Коэффициент корреляции принимает значение в диапазоне:
-1
Знаки коэффициента корреляции и коэффициента регрессии совпадают. Знак говорит о направлении зависимости – положительной (прямой) или отрицательной (обратной).
Величина коэффициента корреляции говорит о тесноте связи:
Составим дополнительную таблицу:
X |
Y |
Z |
XY |
XZ |
29 |
-82 |
28 |
-2378 |
812 |
31 |
-86 |
45 |
-2666 |
1395 |
32 |
-89 |
-38 |
-2848 |
-1216 |
33 |
-93 |
57 |
-3069 |
1881 |
32 |
-88 |
-26 |
-2816 |
-832 |
35 |
-92 |
-26 |
-3220 |
-910 |
33 |
-89 |
49 |
-2937 |
1617 |
29 |
-87 |
-38 |
-2523 |
-1102 |
35 |
-93 |
14 |
-3255 |
490 |
37 |
-98 |
-51 |
-3626 |
-1887 |
36 |
-97 |
-25 |
-3492 |
-900 |
38 |
-97 |
10 |
-3686 |
380 |
39 |
-100 |
-27 |
-3900 |
-1053 |
35 |
-105 |
-62 |
-3675 |
-2170 |
39 |
-100 |
-16 |
-3900 |
-624 |
39 |
-101 |
-30 |
-3939 |
-1170 |
41 |
-111 |
-88 |
-4551 |
-3608 |
41 |
-108 |
-46 |
-4428 |
-1886 |
41 |
-109 |
-23 |
-4469 |
-943 |
41 |
-118 |
-26 |
-4838 |
-1066 |
40 |
-120 |
-90 |
-4800 |
-3600 |
40 |
-107 |
31 |
-4280 |
1240 |
41 |
-117 |
11 |
-4797 |
451 |
45 |
-127 |
10 |
-5715 |
450 |
45 |
-125 |
-27 |
-5625 |
-1215 |
43 |
-120 |
-25 |
-5160 |
-1075 |
47 |
-126 |
-30 |
-5922 |
-1410 |
47 |
-128 |
31 |
-6016 |
1457 |
43 |
-125 |
38 |
-5375 |
1634 |
45 |
-126 |
-16 |
-5670 |
-720 |