Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа
В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.
Введение.
Общая теория статистики
включает два крупных раздела:
описательную статистику и
Задачи в составе
курсового проекта позволяют,
освоит основные
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.
Исходные данные.
N |
X |
Y |
Z |
G |
1 |
29 |
-82 |
28 |
42 |
2 |
31 |
-86 |
45 |
75 |
3 |
32 |
-89 |
-38 |
61 |
4 |
33 |
-93 |
57 |
65 |
5 |
32 |
-88 |
-26 |
69 |
6 |
35 |
-92 |
-26 |
60 |
7 |
33 |
-89 |
49 |
57 |
8 |
29 |
-87 |
-38 |
70 |
9 |
35 |
-93 |
14 |
63 |
10 |
37 |
-98 |
-51 |
55 |
11 |
36 |
-97 |
-25 |
72 |
12 |
38 |
-97 |
10 |
79 |
13 |
39 |
-100 |
-27 |
63 |
14 |
35 |
-105 |
-62 |
70 |
15 |
39 |
-100 |
-16 |
62 |
16 |
39 |
-101 |
-30 |
73 |
17 |
41 |
-111 |
-88 |
82 |
18 |
41 |
-108 |
-46 |
87 |
19 |
41 |
-109 |
-23 |
88 |
20 |
41 |
-118 |
-26 |
85 |
21 |
40 |
-120 |
-90 |
88 |
22 |
40 |
-107 |
31 |
76 |
23 |
41 |
-117 |
11 |
69 |
24 |
45 |
-127 |
10 |
89 |
25 |
45 |
-125 |
-27 |
90 |
26 |
43 |
-120 |
-25 |
86 |
27 |
47 |
-126 |
-30 |
93 |
28 |
47 |
-128 |
31 |
91 |
29 |
43 |
-125 |
38 |
87 |
30 |
45 |
-126 |
-16 |
95 |
Задача 1.
Вычислить показатели вариации по каждой из выборок X,Y,Z
Методика решения
Показатели вариации вычисляются следующим образом.
1. Среднее значение - средняя арифметическая простая.
Среднее арифметическое значение вычислим по формуле:
, ,
где n-объем выборки.
В данном случае n=30
Подставив в формулу известные значения, получим средние арифметические по 3-м выборкам X,Y,Z
x = = 38,4
2. Мода – такое значение варьирующего признака, которое в данном ряду распределения имеет наибольшую частоту. Для нахождения моды необходимо расположить все исходные данные в порядке возрастания. Повторяющиеся значения записываем столько раз, сколько они повторяются в массиве. Затем выбираем значение с наибольшей частотой.
=
Строим дополнительную таблицу:
X |
Y |
Z |
29 |
-128 |
-90 |
29 |
-127 |
-88 |
31 |
-126 |
-62 |
32 |
-126 |
-51 |
32 |
-125 |
-46 |
33 |
-125 |
-38 |
33 |
-120 |
-38 |
35 |
-120 |
-30 |
35 |
-118 |
-30 |
35 |
-117 |
-27 |
36 |
-111 |
-27 |
37 |
-109 |
-26 |
38 |
-108 |
-26 |
39 |
-107 |
-26 |
39 |
-105 |
-25 |
39 |
-101 |
-25 |
40 |
-100 |
-23 |
40 |
-100 |
-16 |
41 |
-98 |
-16 |
41 |
-97 |
10 |
41 |
-97 |
10 |
41 |
-93 |
11 |
41 |
-93 |
14 |
43 |
-92 |
28 |
43 |
-89 |
31 |
45 |
-89 |
31 |
45 |
-88 |
38 |
45 |
-87 |
45 |
47 |
-86 |
49 |
47 |
-82 |
57 |
Найдем значение с наибольшей частотой.
Из таблицы видно, что (X)=41, (Y)=-126, (Z)=-26.
3. Медиана – такое значение варьирующего признака, которое делит ряд распределения на две равные части по объему частот.
Если ряд
распределения дискретный и
если n -
четное
Так как данный ряд состоит из четного числа членов, то используем формулу №2:
4.Размах вариации - показывает разницу между максимальным и минимальным значением.
Найдем максимальное и минимальное значения для X,Y,Z
5.Дисперсия - средний квадрат отклонения от среднего значения.
Построим дополнительную таблицу для последующих вычислений:
№ |
|
|
|
|
|
|
|
| |
1 |
29 |
-128 |
-90 |
12 |
2 |
64 |
144 |
4 |
4096 |
2 |
29 |
-127 |
-88 |
12 |
1 |
62 |
144 |
1 |
3844 |
3 |
31 |
-126 |
-62 |
10 |
0 |
36 |
100 |
0 |
1296 |
4 |
32 |
-126 |
-51 |
9 |
0 |
25 |
81 |
0 |
625 |
5 |
32 |
-125 |
-46 |
9 |
1 |
20 |
81 |
1 |
400 |
6 |
33 |
-125 |
-38 |
8 |
1 |
12 |
64 |
1 |
144 |
7 |
33 |
-120 |
-38 |
8 |
6 |
12 |
64 |
36 |
144 |
8 |
35 |
-120 |
-30 |
6 |
6 |
4 |
36 |
36 |
16 |
9 |
35 |
-118 |
-30 |
6 |
8 |
4 |
36 |
64 |
16 |
10 |
35 |
-117 |
-27 |
6 |
9 |
1 |
36 |
81 |
1 |
11 |
36 |
-111 |
-27 |
5 |
15 |
1 |
25 |
225 |
1 |
12 |
37 |
-109 |
-26 |
4 |
17 |
0 |
16 |
289 |
0 |
13 |
38 |
-108 |
-26 |
3 |
18 |
0 |
9 |
324 |
0 |
14 |
39 |
-107 |
-26 |
2 |
19 |
0 |
4 |
361 |
0 |
15 |
39 |
-105 |
-25 |
2 |
21 |
1 |
4 |
441 |
1 |
16 |
39 |
-101 |
-25 |
2 |
25 |
1 |
4 |
625 |
1 |
17 |
40 |
-100 |
-23 |
1 |
26 |
3 |
1 |
676 |
9 |
18 |
40 |
-100 |
-16 |
1 |
26 |
10 |
1 |
676 |
100 |
19 |
41 |
-98 |
-16 |
0 |
28 |
10 |
0 |
784 |
100 |
20 |
41 |
-97 |
10 |
0 |
29 |
36 |
0 |
841 |
1296 |
21 |
41 |
-97 |
10 |
0 |
29 |
36 |
0 |
841 |
1296 |
22 |
41 |
-93 |
11 |
0 |
33 |
37 |
0 |
1089 |
1369 |
23 |
41 |
-93 |
14 |
0 |
33 |
40 |
0 |
1089 |
1600 |
24 |
43 |
-92 |
28 |
2 |
34 |
54 |
4 |
1156 |
2916 |
25 |
43 |
-89 |
31 |
2 |
37 |
57 |
4 |
1369 |
3249 |
26 |
45 |
-89 |
31 |
4 |
37 |
57 |
16 |
1369 |
3249 |
27 |
45 |
-88 |
38 |
4 |
38 |
64 |
16 |
1444 |
4096 |
28 |
45 |
-87 |
45 |
4 |
39 |
71 |
16 |
1521 |
5041 |
29 |
47 |
-86 |
49 |
6 |
40 |
75 |
36 |
1600 |
5625 |
30 |
47 |
-82 |
57 |
6 |
44 |
83 |
36 |
1936 |
6889 |
Подставив в формулу значения, занесенные в таблицу, рассчитаем дисперсию:
6. Стандартное отклонение – квадратный корень из дисперсии.
=5,8072;
=25,5153;
=40,4372.
7.Среднее линейное отклонение – учитывает различия всех единиц изучаемой совокупности, определяется как среднее арифметическое из отклонений индивидуальных значений без учета знака этих отклонений
Подставим, уже рассчитанные и занесенные в таблицу № значения в формулу:
8.Относительные показатели вариации вычисляют как отношение абсолютного показателя к среднему значению, выраженное в процентах.
Коэффициент осцилляции – отражает относительную колеблемость крайних значений признака вокруг средней
где R- размах вариации
- среднее значение
Подставляя полученные значения в формулу, получим:
Линейный коэффициент вариации – характеризует долю усредненного значения абсолютных отклонений от средней величины
Подставляя полученные значения в формулу, получим:
Коэффициент вариации – используется для сравнения размеров вариации в вариационных рядах с различными средними, а также для сравнения вариации разных показателей в одной и той же совокупности
Подставляя в формулу значения, получим коэффициент вариации:
Задача 2.
По каждой из выборок X, Y, Z:
Методика решения:
Вариационный ряд – это значение признака (или интервалы значений) и их частоты. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.
Для группировки данных вначале выберем число интервалов группирования и границы интервалов. Число групп, по которому разбивается совокупность по количественному признаку, зависит от объема совокупности и разброса значений этого признака. Интервалы должны полностью охватывать все значения признака в изучаемой выборке. Желательно выбрать интервалы равной длины с «круглыми» границами. Для определения числа групп воспользуемся формулой Стерджесса.
где k – число групп;
n – объем выборки (число единиц совокупности)
Используя данную формулу получаем число групп:
6
Следовательно, всю нашу совокупность мы должны разбить на 6 групп.
Поскольку группировка
данных нужна для изучения
формы распределения, мы
После определения
числа групп, мы должны
Ширина интервала – разница между верхней и нижней границами.
где максимальное значение данной совокупности;
минимальное значение донной совокупности;
число групп
Подставляя значения в формулу, получим интервалы группировок для X, Y, Z.
После того как сформированы группы, посчитывают абсолютные частоты – число «попаданий» признака в каждый интервал, т. е число объектов в каждой группе. Каждая единица совокупности учитывается только один раз. Если значение оказывается на границе интервала, его относят к «левому» интервалу и не учитывают в «правом» интервале.
Частости – относительные частоты, выраженные в процентах.
где - частота повторений;
n – объем выборки.
Подставляя значения в формулу, получим частости X,Y,Z:
Накопленные (кумулятивные) частоты:
где - частота повторений j – го значения признака;
i – число вариантов;
Каждая накопленная частость – сумма текущей частости и всех предыдущих.
Для упрощения можно складывать текущую частосту и предыдущую кумулятивную частоту:
При этом считаем, что кумулята начинается с нуля:
Пользуясь формулой, рассчитаем накопленные частоты для X,Y,Z:
Создадим таблицу группировки данных для x:
|
|
|
|
29…32 |
5 |
16,7 |
16,7 |
32…35 |
5 |
16,7 |
33,4 |
35…38 |
3 |
10 |
43,4 |
38…41 |
10 |
33,3 |
76,7 |
41…44 |
2 |
6,6 |
83,3 |
44…47 |
5 |
16,7 |
100 |