Методы описательной статистики

Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа

Описание работы

В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.

Файлы: 1 файл

Курсовая.doc

— 3.02 Мб (Скачать файл)

Создадим таблицу группировки  данных для y:

                            Таблица №5.

-128…-120

8

26,7

26,7

-120…-112

2

6,6

33,3

-112…-104

5

16,7

50

-104…-96

6

20

70

-96…-88

6

20

90

-88…-80

3

10

100


Создадим таблицу группировки  данных для z:

                                                                                   Таблица №6.

-90…-65

2

6,6

6,6

-65…-40

3

10

16,6

-40…-15

14

46,7

63,3

-15…10

2

6,6

69,9

10…35

5

16,7

86,6

35…60

4

13,4

100


 

Мы видим, что сумма частостей  и последние накопленные частоты  равны 100%, следовательно, расчеты выполнены  без ошибок.

 

     Любой ряд распределения  удобно анализировать при помощи  его графического изображения.  Графическое представление вариационного ряда представляет собой эмпирическую оценку формы теоретического распределения. Гистограмма и полигон частот соответствуют плотности вероятности, а кумулята – функции распределения.

     Гистограмма – столбиковая диаграмма частот. Основание каждого прямоугольника соответствует интервалу группировки. Высота столбика – частость.

 Построим гистограммы для  наших полученных частот X,Y,Z.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 3.

 

     По сгруппированным  данным и графикам определить

  • среднее арифметическое;
  • моду;
  • медиану;

Методика решения

     При расчетах по  сгруппированным данным учитывается  относительная частота появления  каждого варианта

где - частота, показывающая сколько раз встречается i – ое значения усредняемого

признака;

    Построим вспомогательные таблицы:

                                                       Таблица №7 «Расчет среднего значения X».

 

 

  

29…32

5

30,5

152,5

32…35

5

33,5

12

35…38

3

36,5

20

38…41

10

39,5

395

41…44

2

42,5

85

44…47

5

45,5

227,5

Σ

30

228

892




 

 

 

 

 

 

 

                                                       

                                                       Таблица №8 «Расчет среднего значения Y».

 

 

 

  

-128…-120

8

-124

-992

-120…-112

2

-116

-232

-112…-104

5

-108

-540

-104…-96

6

-100

-600

-96…-88

6

-92

-552

-88…-80

3

-84

-2916

Σ

30

-624

-5832


 

 

                                                       Таблица №9 «Расчет среднего значения Z».

 

-90…-65

2

-77,5

-155

-65…-40

3

-52,5

-157,5

-40…-15

14

-27,5

-385

-15…10

2

2,5

5

10…35

5

22,5

112,5

35…60

4

47,5

190

30

-85

-390


 
 
Найдем средние значение , , :

 

     Мода - это координата основания самого высокого столбика гистограммы, т.е. модального интервала. Распределение может иметь несколько мод. В качестве оценки моды используют не середину модального интервала, а скорректированное значение.

  

    Медиана - определяется как 50%-й квантиль. Это аргумент функции распределения, при котором вероятность равна 0,5=50%

Me:  F(Me)=0.5=50% -

 

Медиана делит упорядоченную совокупность пополам.

     Оценки моды  и медианы, полученные по результатам  группировки, могут отличаться от оценок показателей, полученных без группировки. Группировка данных – это обобщение, укрупнение, при котором могут теряться отдельные мелкие подробности, но зато становится видна «картина в целом».

 

 

 

 

 

 

 

 

 

 

Задача 4.

 

     Построить корреляционное поле. Провести группировку Y и Z, используя X как группировочный признак. Вычислить условные средние , . Нанести линию эмпирической регрессии на корреляционное поле.

    Методика решения

     Корреляционное поле – это графическое изображение исходных данных.Каждый изучаемый объект (единица совокупности) характеризуется парой значений { и изображается точкой. Поскольку объекты в составе выборочной совокупности считаются независимыми, точки на графике не соединяют линиями. График должен быть достаточно большим, чтобы его можно легко анализировать. Масштаб по координатным осям выбирается так, чтобы эффективно использовать все доступное место на графике. Для этого определяют минимальное и максимальное значение для X и Y, затем округляют их в меньшую и большую сторону соответственно – до ближайшего «стандартного» круглого числа.

    Группировка данных – это деление совокупности на группы единиц по какому-либо признака. Этот признак называют группировочным. Группировка позволяет оценить характер зависимости между переменными путем вычисления условного среднего.

Проведем группировку данных по Y и Z, используя X как группировочный признак. Для этого данные ряда X расположим в порядке возрастания. Затем составляем новые ряды Y и Z.

Таблица №10«Группировка данных Y и Z , построенная по группировочному признаку X»

X

Y

Z

29

-82

28

29

-86

45

31

-89

-38

32

-93

57

32

-88

-26

33

-92

-26

33

-89

49

35

-87

-38

35

-93

14

35

-98

-51

36

-97

-25

37

-97

10

38

-100

-27

39

-105

-62

39

-100

-16

39

-101

-30

40

-111

-88

40

-108

-46

41

-109

-23

41

-118

-26

41

-120

-90

41

-107

31

41

-117

11

43

-127

10

43

-125

-27

45

-120

-25

45

-126

-30

45

-128

31

47

-125

38

47

-126

-16


 

Условное среднее значение – это среднее значение одного признака при условии, что другой признак принимает заранее заданное фиксированное значение:

    

     При вычислении условных  средних значений подсчитываем средние и для каждой группы единиц в зависимости от значения группировочного признака х.

 

Полученные значения заносим в  таблицу.

                                                                                             Таблица №11 «Условные средние».

 

29…32

30,5

5

-438

-87,6

66

13,2

32…35

33,5

5

-459

-91,8

-52

-10,4

35…38

36,5

3

-294

-98

-42

-14

38…41

39,5

10

-1096

-109,6

-339

-33,4

41…44

42,5

2

-252

-126

-17

-8,5

44…47

45,5

5

-625

-125

-2

-0,4


 

 

     Для построения эмпирической  регрессии, на поле корреляции нужно нанести точки с координатами { и соединить их отрезками прямых линий.

     По внешнему  виду графика можно выявить  возможный характер взаимосвязи  между признаками и оценить  погрешность построения уравнения  регрессии.

Информация о работе Методы описательной статистики