Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа
В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.
Создадим таблицу группировки данных для y:
Таблица №5.
|
|
|
|
-128…-120 |
8 |
26,7 |
26,7 |
-120…-112 |
2 |
6,6 |
33,3 |
-112…-104 |
5 |
16,7 |
50 |
-104…-96 |
6 |
20 |
70 |
-96…-88 |
6 |
20 |
90 |
-88…-80 |
3 |
10 |
100 |
Создадим таблицу группировки данных для z:
|
|
|
|
-90…-65 |
2 |
6,6 |
6,6 |
-65…-40 |
3 |
10 |
16,6 |
-40…-15 |
14 |
46,7 |
63,3 |
-15…10 |
2 |
6,6 |
69,9 |
10…35 |
5 |
16,7 |
86,6 |
35…60 |
4 |
13,4 |
100 |
Мы видим, что сумма частостей
и последние накопленные
Любой ряд распределения
удобно анализировать при
Гистограмма – столбиковая диаграмма частот. Основание каждого прямоугольника соответствует интервалу группировки. Высота столбика – частость.
Построим гистограммы для наших полученных частот X,Y,Z.
Задача 3.
По сгруппированным данным и графикам определить
Методика решения
При расчетах по
сгруппированным данным
где - частота, показывающая сколько раз встречается i – ое значения усредняемого
признака;
Построим вспомогательные таблицы:
29…32 |
5 |
30,5 |
152,5 |
32…35 |
5 |
33,5 |
12 |
35…38 |
3 |
36,5 |
20 |
38…41 |
10 |
39,5 |
395 |
41…44 |
2 |
42,5 |
85 |
44…47 |
5 |
45,5 |
227,5 |
Σ |
30 |
228 |
892 |
|
|||
-128…-120 |
8 |
-124 |
-992 |
-120…-112 |
2 |
-116 |
-232 |
-112…-104 |
5 |
-108 |
-540 |
-104…-96 |
6 |
-100 |
-600 |
-96…-88 |
6 |
-92 |
-552 |
-88…-80 |
3 |
-84 |
-2916 |
Σ |
30 |
-624 |
-5832 |
Таблица №9 «Расчет среднего значения Z».
-90…-65 |
2 |
-77,5 |
-155 |
-65…-40 |
3 |
-52,5 |
-157,5 |
-40…-15 |
14 |
-27,5 |
-385 |
-15…10 |
2 |
2,5 |
5 |
10…35 |
5 |
22,5 |
112,5 |
35…60 |
4 |
47,5 |
190 |
∑ |
30 |
-85 |
-390 |
Найдем средние значение
,
,
:
Мода - это координата основания самого высокого столбика гистограммы, т.е. модального интервала. Распределение может иметь несколько мод. В качестве оценки моды используют не середину модального интервала, а скорректированное значение.
Медиана - определяется как 50%-й квантиль. Это аргумент функции распределения, при котором вероятность равна 0,5=50%
Me: F(Me)=0.5=50% -
Медиана делит упорядоченную
Оценки моды
и медианы, полученные по
Задача 4.
Построить корреляционное поле. Провести группировку Y и Z, используя X как группировочный признак. Вычислить условные средние , . Нанести линию эмпирической регрессии на корреляционное поле.
Методика решения
Корреляционное поле – это графическое изображение исходных данных.Каждый изучаемый объект (единица совокупности) характеризуется парой значений { и изображается точкой. Поскольку объекты в составе выборочной совокупности считаются независимыми, точки на графике не соединяют линиями. График должен быть достаточно большим, чтобы его можно легко анализировать. Масштаб по координатным осям выбирается так, чтобы эффективно использовать все доступное место на графике. Для этого определяют минимальное и максимальное значение для X и Y, затем округляют их в меньшую и большую сторону соответственно – до ближайшего «стандартного» круглого числа.
Группировка данных – это деление совокупности на группы единиц по какому-либо признака. Этот признак называют группировочным. Группировка позволяет оценить характер зависимости между переменными путем вычисления условного среднего.
Проведем группировку данных по Y и Z, используя X как группировочный признак. Для этого данные ряда X расположим в порядке возрастания. Затем составляем новые ряды Y и Z.
Таблица №10«Группировка данных Y и Z , построенная по группировочному признаку X»
X |
Y |
Z |
29 |
-82 |
28 |
29 |
-86 |
45 |
31 |
-89 |
-38 |
32 |
-93 |
57 |
32 |
-88 |
-26 |
33 |
-92 |
-26 |
33 |
-89 |
49 |
35 |
-87 |
-38 |
35 |
-93 |
14 |
35 |
-98 |
-51 |
36 |
-97 |
-25 |
37 |
-97 |
10 |
38 |
-100 |
-27 |
39 |
-105 |
-62 |
39 |
-100 |
-16 |
39 |
-101 |
-30 |
40 |
-111 |
-88 |
40 |
-108 |
-46 |
41 |
-109 |
-23 |
41 |
-118 |
-26 |
41 |
-120 |
-90 |
41 |
-107 |
31 |
41 |
-117 |
11 |
43 |
-127 |
10 |
43 |
-125 |
-27 |
45 |
-120 |
-25 |
45 |
-126 |
-30 |
45 |
-128 |
31 |
47 |
-125 |
38 |
47 |
-126 |
-16 |
Условное среднее значение – это среднее значение одного признака при условии, что другой признак принимает заранее заданное фиксированное значение:
При вычислении условных средних значений подсчитываем средние и для каждой группы единиц в зависимости от значения группировочного признака х.
Полученные значения заносим в таблицу.
29…32 |
30,5 |
5 |
-438 |
-87,6 |
66 |
13,2 |
32…35 |
33,5 |
5 |
-459 |
-91,8 |
-52 |
-10,4 |
35…38 |
36,5 |
3 |
-294 |
-98 |
-42 |
-14 |
38…41 |
39,5 |
10 |
-1096 |
-109,6 |
-339 |
-33,4 |
41…44 |
42,5 |
2 |
-252 |
-126 |
-17 |
-8,5 |
44…47 |
45,5 |
5 |
-625 |
-125 |
-2 |
-0,4 |
Для построения эмпирической регрессии, на поле корреляции нужно нанести точки с координатами { и соединить их отрезками прямых линий.
По внешнему
виду графика можно выявить
возможный характер