Методы описательной статистики

Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа

Описание работы

В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.

Файлы: 1 файл

Курсовая.doc

— 3.02 Мб (Скачать файл)

Введение.

 

     Общая теория статистики  включает два крупных раздела:  описательную статистику и аналитическую  статистику. В курсовом проекте  рассматриваются методы описательной  статистики: группировка данных, построение  статистических таблиц и графиков, а также вычисление основных статистических показателей.

     Задачи в составе  курсового проекта позволяют,  освоит основные статистические  методы.  Для использования этих  методов, требуется понимание  соответствующих разделов общей  теории статистики.

     Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Исходные данные.

                                     Таблица №1 «Исходные данные».

N

X

Y

Z

G

1

29

-82

28

42

2

31

-86

45

75

3

32

-89

-38

61

4

33

-93

57

65

5

32

-88

-26

69

6

35

-92

-26

60

7

33

-89

49

57

8

29

-87

-38

70

9

35

-93

14

63

10

37

-98

-51

55

11

36

-97

-25

72

12

38

-97

10

79

13

39

-100

-27

63

14

35

-105

-62

70

15

39

-100

-16

62

16

39

-101

-30

73

17

41

-111

-88

82

18

41

-108

-46

87

19

41

-109

-23

88

20

41

-118

-26

85

21

40

-120

-90

88

22

40

-107

31

76

23

41

-117

11

69

24

45

-127

10

89

25

45

-125

-27

90

26

43

-120

-25

86

27

47

-126

-30

93

28

47

-128

31

91

29

43

-125

38

87

30

45

-126

-16

95


                                                             

 

 

 

 

 

 

 

 

Задача 1.

     Вычислить показатели  вариации по каждой из выборок  X,Y,Z

  • среднее арифметическое;
  • моду;
  • медиану;
  • размах вариации;
  • дисперсию;
  • стандартное отклонение;
  • среднее линейное отклонение;
  • коэффициенты осцилляции и вариации.

 

Методика решения

     Показатели вариации вычисляются следующим образом.

1. Среднее значение - средняя арифметическая простая.

Среднее арифметическое значение вычислим по формуле:

,       ,    

  где n-объем выборки.

В данном случае n=30

Подставив в формулу известные  значения, получим средние арифметические по 3-м выборкам X,Y,Z

   x = = 38,4

 

  

 

2. Мода – такое значение варьирующего признака, которое в данном ряду распределения имеет наибольшую частоту. Для нахождения моды необходимо расположить все исходные данные в порядке возрастания. Повторяющиеся значения записываем столько раз, сколько они повторяются в массиве. Затем выбираем значение с наибольшей частотой.

=

Строим дополнительную таблицу:                                                                                                                                              Таблица №2 «X,Y,Z в возрастающем порядке».

X

Y

Z

29

-128

-90

29

-127

-88

31

-126

-62

32

-126

-51

32

-125

-46

33

-125

-38

33

-120

-38

35

-120

-30

35

-118

-30

35

-117

-27

36

-111

-27

37

-109

-26

38

-108

-26

39

-107

-26

39

-105

-25

39

-101

-25

40

-100

-23

40

-100

-16

41

-98

-16

41

-97

10

41

-97

10

41

-93

11

41

-93

14

43

-92

28

43

-89

31

45

-89

31

45

-88

38

45

-87

45

47

-86

49

47

-82

57


 

                                                                                                                                        

 

Найдем значение с наибольшей частотой.

Из таблицы видно, что  (X)=41, (Y)=-126, (Z)=-26.

 

3. Медиана – такое значение варьирующего признака, которое делит ряд распределения на две равные части по объему частот.

     Если ряд  распределения дискретный и состоит  из четного числа членов, то  медиана определяется как средняя  величина из двух серединных  значений ранжированного ряда. Если  в дискретном ряду нечетное  число уровней, то медианой  будет серединное значение ранжированного ряда.

        если n - четное                                       

Так как данный ряд состоит из четного числа членов, то используем формулу №2:

 

4.Размах вариации - показывает разницу между максимальным и минимальным значением.

Найдем максимальное и минимальное  значения для X,Y,Z 

 

5.Дисперсия - средний квадрат отклонения от среднего значения.

Построим дополнительную таблицу для последующих вычислений:

                                                                                                                                 Таблица №3.

 

1

29

-128

-90

12

2

64

144

4

4096

2

29

-127

-88

12

1

62

144

1

3844

3

31

-126

-62

10

0

36

100

0

1296

4

32

-126

-51

9

0

25

81

0

625

5

32

-125

-46

9

1

20

81

1

400

6

33

-125

-38

8

1

12

64

1

144

7

33

-120

-38

8

6

12

64

36

144

8

35

-120

-30

6

6

4

36

36

16

9

35

-118

-30

6

8

4

36

64

16

10

35

-117

-27

6

9

1

36

81

1

11

36

-111

-27

5

15

1

25

225

1

12

37

-109

-26

4

17

0

16

289

0

13

38

-108

-26

3

18

0

9

324

0

14

39

-107

-26

2

19

0

4

361

0

15

39

-105

-25

2

21

1

4

441

1

16

39

-101

-25

2

25

1

4

625

1

17

40

-100

-23

1

26

3

1

676

9

18

40

-100

-16

1

26

10

1

676

100

19

41

-98

-16

0

28

10

0

784

100

20

41

-97

10

0

29

36

0

841

1296

21

41

-97

10

0

29

36

0

841

1296

22

41

-93

11

0

33

37

0

1089

1369

23

41

-93

14

0

33

40

0

1089

1600

24

43

-92

28

2

34

54

4

1156

2916

25

43

-89

31

2

37

57

4

1369

3249

26

45

-89

31

4

37

57

16

1369

3249

27

45

-88

38

4

38

64

16

1444

4096

28

45

-87

45

4

39

71

16

1521

5041

29

47

-86

49

6

40

75

36

1600

5625

30

47

-82

57

6

44

83

36

1936

6889


 

 

Подставив в формулу значения, занесенные в таблицу, рассчитаем дисперсию:

 

6. Стандартное отклонение – квадратный корень из дисперсии.

=5,8072;

 =25,5153;    

=40,4372.

7.Среднее линейное отклонение – учитывает различия всех единиц изучаемой совокупности, определяется как среднее арифметическое из отклонений индивидуальных значений без учета знака этих отклонений

Подставим, уже рассчитанные и занесенные в таблицу № значения в формулу:

8.Относительные показатели вариации вычисляют как отношение абсолютного показателя к среднему значению, выраженное в процентах.

     Коэффициент осцилляции – отражает относительную колеблемость крайних значений признака вокруг средней

             где R- размах вариации

   - среднее значение

 

Подставляя полученные значения в  формулу, получим:

   Линейный коэффициент вариации – характеризует долю усредненного значения абсолютных отклонений от средней величины

Подставляя полученные значения в  формулу, получим:

  Коэффициент вариации – используется для сравнения размеров вариации в вариационных рядах с различными средними, а также для сравнения вариации разных показателей в одной и той же совокупности

Подставляя в формулу значения, получим коэффициент вариации:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2.

 

     По каждой из выборок X, Y, Z:

  • провести группировку данных по интервалам равной длины;
  • составить вариационный ряд;
  • вычислить относительные частоты и накопленные частости;
  • построить полигон, гистограмму и кумуляту;
  • нанести на график кумуляты график накопленных частот без группировки

 

Методика решения:

     Вариационный ряд – это значение признака (или интервалы значений) и их частоты. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

Для группировки данных вначале  выберем число интервалов группирования и границы интервалов. Число групп, по которому разбивается совокупность по количественному признаку, зависит от объема совокупности и разброса значений этого признака. Интервалы должны полностью охватывать все значения признака в изучаемой выборке. Желательно выбрать интервалы равной длины с «круглыми» границами. Для определения числа групп воспользуемся формулой Стерджесса.

 

 

где k – число групп;

n – объем выборки (число единиц совокупности)

 

Используя данную формулу получаем число групп:

 

6

Следовательно, всю нашу совокупность мы должны разбить на 6 групп.

     Поскольку группировка  данных нужна для изучения  формы распределения, мы должны  учитывать, что с одной стороны,  число интервалов должно быть достаточно большим, чтобы изучить форму распределения. С другой стороны, число интервалов не должно быть слишком большим – тогда в каждый диапазон попадает несколько единиц совокупности. Желательно избегать получения «малочисленных» или пустых групп.

     После определения  числа групп, мы должны определить  интервал группировки.

Ширина  интервала – разница между верхней и нижней границами.

 

 

где  максимальное значение данной совокупности;

минимальное значение донной совокупности;

       число групп

 

Подставляя значения в формулу, получим интервалы группировок  для X, Y, Z.

 

 

                                                            

     После того как  сформированы группы, посчитывают абсолютные частоты – число «попаданий» признака в каждый интервал, т. е число объектов в каждой группе. Каждая единица совокупности учитывается только один раз. Если значение  оказывается на границе интервала, его относят к «левому» интервалу и не учитывают в «правом» интервале.

Частости – относительные частоты, выраженные в процентах.

где - частота повторений;

n – объем выборки.

Подставляя значения в формулу, получим частости X,Y,Z:

 

Накопленные (кумулятивные) частоты:

где  - частота повторений j – го значения признака;

 i – число вариантов;

Каждая накопленная частость –  сумма текущей частости и всех предыдущих.

Для упрощения можно складывать текущую частосту и предыдущую кумулятивную частоту:

 

При этом считаем, что кумулята начинается с нуля:

Пользуясь формулой, рассчитаем накопленные  частоты для X,Y,Z:

  

    

 

Создадим таблицу группировки  данных для x:

                                                                                 Таблица №4.

29…32

5

16,7

16,7

32…35

5

16,7

33,4

35…38

3

10

43,4

38…41

10

33,3

76,7

41…44

2

6,6

83,3

44…47

5

16,7

100

Информация о работе Методы описательной статистики