Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа
В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей. 
     Задачи в составе курсового проекта позволяют, освоить основные статистические методы.  Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики. 
     Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.
Задача 5.
Найти предельную ошибку выборки X,Y,Z; построить доверительные интервалы для среднего при доверительной вероятности p=68%, 95%, 99,7%.
Методика решения
Выборочное среднее значение , вычисляемое по выборке ограниченного объема n, будет отличаться от идеального «точного» значения , которое можно было бы получить для бесконечно большой выборки. Разница между выборочным средним и математическим ожиданием (генеральным средним) называется ошибкой выборки:
Ошибка выборочного наблюдения пропорциональна стандартному отклонению и обратно пропорциональна квадратному корню из объема выборки:
Искомое значение t для заданного р находится по формуле:
Доверительный интервал для генерального среднего:
                              
     Для того чтобы 
найти ошибку выборочного 
Таблица№12 «Процентные точки распределения Стьюдента t(n,p) и нормального распределения»
n  | 
  p  | |||||||
0,5  | 
  0,6  | 
  0,7  | 
  0,8  | 
  0,9  | 
  0,95  | 
  0,99  | 
  0,999  | |
5  | 
  0  | 
  0,2672  | 
  0,5594  | 
  0,9195  | 
  1,4759  | 
  2,0150  | 
  3,3649  | 
  5,8934  | 
10  | 
  0  | 
  0,2602  | 
  0,5415  | 
  0,8791  | 
  1,3722  | 
  1,8125  | 
  2,7638  | 
  4,1437  | 
20  | 
  0  | 
  0,2567  | 
  0,5329  | 
  0,8600  | 
  1,3253  | 
  1,7247  | 
  2,5280  | 
  3,5518  | 
30  | 
  0  | 
  0,2556  | 
  0,5300  | 
  0,8538  | 
  1,3104  | 
  1,6973  | 
  2,4573  | 
  3,3852  | 
40  | 
  0  | 
  0,2550  | 
  0,5286  | 
  0,8507  | 
  1,3031  | 
  1,6839  | 
  2,4233  | 
  3,3069  | 
50  | 
  0  | 
  0,2547  | 
  0,5278  | 
  0,8489  | 
  1,2987  | 
  1,6759  | 
  2,4033  | 
  3,2614  | 
100  | 
  0  | 
  0,2540  | 
  0,5261  | 
  0,8452  | 
  1,2901  | 
  1,6602  | 
  2,3642  | 
  3,1737  | 
1000  | 
  0  | 
  0,2534  | 
  0,5246  | 
  0,8420  | 
  1,2824  | 
  1,6464  | 
  2,3301  | 
  3,0984  | 
z  | 
  0  | 
  0,2533  | 
  0,5244  | 
  0,8416  | 
  1,2816  | 
  1,6449  | 
  2,3263  | 
  3,0902  | 
и ; и ;
Подставляя найденные значения в формулу, найдем t(x):
Ошибка выборочного наблюдения (X):
Доверительный интервал для генерального среднего :
Доверительная вероятность для среднего X: р= 0,95
В таблице, значению р= 0,95 соответствует t=1,6973
Ошибка выборочного наблюдения (Y):
Доверительный интервал для генерального среднего :
Ошибка выборочного наблюдения (Z):
Доверительная вероятность p=0,997 находится между двумя значениями, следовательно, проведем интерполяцию. Таким образом, и ; и ;
Ошибка выборочного наблюдения (Z):
Задача 6.
     Построить доверительные 
интервалы для генерального 
Методика решения
Форма распределения Стьюдента приближается к нормальному распределению при большом объеме выборки, начиная с нескольких десятков единиц. При этом погрешность от замены распределения Стьюдента нормальным распределением не превышает единиц процентов.
Таблица №13. «Процентные точки распределения Фишера для выборок равного объема: »
Вероятность (округлено)  | 
  Вероятность  | 
  Коэффициент доверия  | 
  Ошибка выборки  | 
  Доверительный интервал  | 
68%  | 
  0,682689  | 
  1,000  | 
  одна сигма  | 
  |
| 
   95%  | 
  0,954500  | 
  2,000  | 
  две сигмы  | 
  |
| 
   99,7%  | 
  0,997300  | 
  3,000  | 
  три сигмы  | 
  
Таким образом, получаем приближенные 
границы доверительных 
а)
Стандартное отклонение выборочного среднего(X):
Доверительный интервал для генерального среднего :
б)
Стандартное отклонение выборочного среднего(Y):
Доверительный интервал для генерального среднего :
в)
Стандартное отклонение выборочного среднего(Z):
Доверительный интервал для генерального среднего :
Задача 7.
При уровне значимости %; 5%; 0,3% проверить гипотезы:
Методика решения
Проверка статистических гипотез основана на использовании стандартных распределений. Изучаемый статистический показатель преобразуется к случайной величине с известным стандартным законом распределения. Затем находится вероятность, по которой находиться квантиль.
Вероятность принятия ошибочного решения при проверке гипотез называют уровнем значимости.
Уровень значимости определяет, в каком проценте случаев возможна ошибка, если принять изучаемую гипотезу.
Можно считать, что область применения гипотезы соответствует доверительному интервалу, а за его пределами находится критическая область.
     Если фактическая 
статистика оказывается в 
Сравнение дисперсий – проверка гипотезы о том, можно ли считать сравнимые выборочные дисперсии и оценками одной и той же генеральной дисперсии. Используется распределение Фишера. При заданном уровне значимости должно выполняться следующее неравенство:
Проверим гипотезы = , при
а) α=32%
Найдем отношение дисперсий:
Из уравнения следует:
p=1-0,32=0,68
Используя таблицу Фишера, найдем коэффициент кратности ошибки выборки.
Таблица №14 «Процентные точки 
объема: »
n  | 
  p  | |||||||
0,5  | 
  0,6  | 
  0,7  | 
  0,8  | 
  0,9  | 
  0,95  | 
  0,99  | 
  0,999  | |
5  | 
  1,0  | 
  1,2692  | 
  1,6410  | 
  2,2275  | 
  3,4530  | 
  5,0503  | 
  10,967  | 
  29,752  | 
10  | 
  1,0  | 
  1,1787  | 
  1,4061  | 
  1,7316  | 
  2,3226  | 
  2,9782  | 
  4,8491  | 
  8,7539  | 
20  | 
  1,0  | 
  1,1216  | 
  1,2684  | 
  1,4656  | 
  1,7938  | 
  2,1242  | 
  2,9377  | 
  4,2900  | 
30  | 
  1,0  | 
  1,0978  | 
  1,2132  | 
  1,3641  | 
  1,6065  | 
  1,8409  | 
  2,3860  | 
  3,2171  | 
40  | 
  1,0  | 
  1,0840  | 
  1,1817  | 
  1,3076  | 
  1,5056  | 
  1,6928  | 
  2,1142  | 
  2,7268  | 
50  | 
  1,0  | 
  1,0747  | 
  1,1608  | 
  1,2706  | 
  1,4409  | 
  1,5995  | 
  1,9490  | 
  2,4413  | 
Согласно таблице и ; и ;
Так как фактическая статистика оказалась в критической области, то гипотеза отвергается.
б) α=5%
Из уравнения имеем:
p=1 - 0,05 = 0,95
В таблице Фишера, значению р= 0,95 соответствует t=1,8409
Проверим гипотезу:
Так как фактическая статистика оказалась в области принятия гипотезы, то гипотеза принимается.
в) α=0,3%
Из уравнения имеем:
p=1-0,003=0,997
Из таблицы следует и ; и ;
Проверим гипотезу:
, 3,03
Так как фактическая статистика оказалась в области принятия гипотезы, то гипотеза принимается.
1) %
По таблице Стьюдента находим t:
При известных значениях =38,4 и =--105,46667 проверим гипотезу:
67,06667>2,4
Гипотеза отвергается, так как фактическая статистика больше, чем табличное значение.
б) α=5%
В таблице Стьюдента, значению р= 0,95 соответствует t=1,6973
67,06667>8,58
Гипотеза отвергается, так как фактическая статистика больше, чем табличное значение.
в) α=0,3%
и ; и ;
67,06667>16,08
Гипотеза отвергается, так как фактическая статистика больше, чем табличное значение.
Задача 8.
Вычислить линейные коэффициенты корреляции и . Сделать вывод о тесноте линейной связи между признаками.
Методика решения
Линейный коэффициент корреляции вычисляется следующим образом:
Коэффициент корреляции принимает значение в диапазоне:
-1
Знаки коэффициента корреляции и коэффициента регрессии совпадают. Знак говорит о направлении зависимости – положительной (прямой) или отрицательной (обратной).
Величина коэффициента корреляции говорит о тесноте связи:
Составим дополнительную таблицу:
                              
X  | 
  Y  | 
  Z  | 
  XY  | 
  XZ  | 
29  | 
  -82  | 
  28  | 
  -2378  | 
  812  | 
31  | 
  -86  | 
  45  | 
  -2666  | 
  1395  | 
32  | 
  -89  | 
  -38  | 
  -2848  | 
  -1216  | 
33  | 
  -93  | 
  57  | 
  -3069  | 
  1881  | 
32  | 
  -88  | 
  -26  | 
  -2816  | 
  -832  | 
35  | 
  -92  | 
  -26  | 
  -3220  | 
  -910  | 
33  | 
  -89  | 
  49  | 
  -2937  | 
  1617  | 
29  | 
  -87  | 
  -38  | 
  -2523  | 
  -1102  | 
35  | 
  -93  | 
  14  | 
  -3255  | 
  490  | 
37  | 
  -98  | 
  -51  | 
  -3626  | 
  -1887  | 
36  | 
  -97  | 
  -25  | 
  -3492  | 
  -900  | 
38  | 
  -97  | 
  10  | 
  -3686  | 
  380  | 
39  | 
  -100  | 
  -27  | 
  -3900  | 
  -1053  | 
35  | 
  -105  | 
  -62  | 
  -3675  | 
  -2170  | 
39  | 
  -100  | 
  -16  | 
  -3900  | 
  -624  | 
39  | 
  -101  | 
  -30  | 
  -3939  | 
  -1170  | 
41  | 
  -111  | 
  -88  | 
  -4551  | 
  -3608  | 
41  | 
  -108  | 
  -46  | 
  -4428  | 
  -1886  | 
41  | 
  -109  | 
  -23  | 
  -4469  | 
  -943  | 
41  | 
  -118  | 
  -26  | 
  -4838  | 
  -1066  | 
40  | 
  -120  | 
  -90  | 
  -4800  | 
  -3600  | 
40  | 
  -107  | 
  31  | 
  -4280  | 
  1240  | 
41  | 
  -117  | 
  11  | 
  -4797  | 
  451  | 
45  | 
  -127  | 
  10  | 
  -5715  | 
  450  | 
45  | 
  -125  | 
  -27  | 
  -5625  | 
  -1215  | 
43  | 
  -120  | 
  -25  | 
  -5160  | 
  -1075  | 
47  | 
  -126  | 
  -30  | 
  -5922  | 
  -1410  | 
47  | 
  -128  | 
  31  | 
  -6016  | 
  1457  | 
43  | 
  -125  | 
  38  | 
  -5375  | 
  1634  | 
45  | 
  -126  | 
  -16  | 
  -5670  | 
  -720  |