Методы описательной статистики

Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа

Описание работы

В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.

Файлы: 1 файл

Курсовая.doc

— 3.02 Мб (Скачать файл)

 

Вычислим средние значения и

Линейный коэффициент корреляции:

Т.к  следовательно, линейная зависимость происходит на фоне отклонений.

Т.к  то это слабая, несущественная линейная зависимость.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 9.

 

     Вычислить коэффициенты  корреляции рангов Спирмена и  Кендалла Y(X) и Z(X). Сделать вывод о тесноте связи.

Методика решения

   Ранговый коэффициент корреляции характеризует общий характер нелинейной зависимости: возрастание или убывание результативного признака при возрастании факторного. Это показатель тесноты монотонной нелинейной связи.

   Коэффициент корреляции рангов Спирмена: 

     

где     - разность рангов X и Y;

n – число наблюдений( число пар, число разностей рангов);

6 – число шесть (не путать  с сигмой)

   Для вычисления рангов  коэффициентов исходные данные  ранжируют, т.е. расставляют  по порядку возрастания или убывания, а затем нумеруют. Ранг – это порядковый номер. Если встречается два одинаковых значения, им присваивают одинаковое значение ранга, равное среднему арифметическому рангов этих значений.

    Таблица №13 « Коэффициент корреляции рангов Спирмена».

x

y

z

29

-128

-90

1,5

1

1

0,5

0,5

0,25

0,25

29

-127

-88

1,5

2

2

-0,5

-0,5

0,25

0,25

31

-126

-62

3

3,5

3

-0,5

0

0,25

0

32

-126

-51

4,5

3,5

4

1

0,5

1

0,25

32

-125

-46

5

5,5

5

-0,5

0

0,25

0

33

-125

-38

6,5

5,5

6,5

1

0

1

0

33

-120

-38

6,5

7,5

6,5

-1

0

1

0

35

-120

-30

9

7,5

8,5

1,5

0,5

2,25

0,25

35

-118

-30

9

9

8,5

0

0,5

0

0,25

35

-117

-27

9

10

10,5

-1

-1,5

1

2,25

36

-111

-27

11

11

10,5

0

0,5

0

0,25

37

-109

-26

12

12

13

0

-1

0

1

38

-108

-26

13

13

13

0

0

0

0

39

-107

-26

15

14

13

1

2

1

4

39

-105

-25

15

15

15,5

0

-0,5

0

0,25

39

-101

-25

15

16

15,5

-1

-0,5

1

0,25

40

-100

-23

17,5

17,5

17

0

0,5

0

0,25

40

-100

-16

17,5

17,5

18,5

0

-1

0

1

41

-98

-16

21

19

18,5

2

2,5

4

6,25

41

-97

10

21

20,5

20,5

0,5

0,5

0,25

0,25

41

-97

10

21

20,5

20,5

0,5

0,5

0,25

0,25

41

-93

11

21

22,5

22

-1,5

-1

2,25

1

41

-93

14

21

22,5

23

-1,5

-2

2,25

4

43

-92

28

24,5

24

24

0,5

0,5

0,25

0,25

43

-89

31

24,5

25,5

25,5

-1

-1

1

1

45

-89

31

27

25,5

25,5

1,5

1,5

2,25

2,25

45

-88

38

27

27

27

0

0

0

0

45

-87

45

27

28

28

-1

-1

1

1

47

-86

49

29,5

29

29

0,5

0,5

0,25

0,25

47

-82

57

29,5

30

30

-0,5

-0,5

0,25

0,25


 

Подставляем полученные значения в  формулу, получим:

 

 

 

Ранговый коэффициент  корреляции Кендалла:

где  n – число наблюдений; 

S=P-Q – разность сумм числа последовательностей и инверсий результативного признака.

     В процессе вычислений  факторный признак X упорядочивается по возрастанию с присвоением порядкового номера (ранжируется). Затем результативный признак Y упорядочивается по возрастанию факторного признака X. 

    Число последовательностей P для каждого ранга Y – это число следующих рангов, превышающих эту величину. 

    Число инверсий Q для каждого ранга Y – это число следующих рангов, меньших выбранного.

Таблица №14 «Число последовательностей и инверсий результативного признака».

29

-82

0

29

29

-86

1

28

31

-89

4

24

32

-93

7

21

32

-88

3

26

33

-92

6

23

33

-89

4

24

35

-87

2

27

35

-93

7

21

35

-98

11

18

36

-97

9

19

37

-97

9

19

38

-100

12

16

39

-105

15

14

39

-100

12

16

39

-101

14

15

40

-111

19

10

40

-108

17

12

41

-109

18

11

41

-118

21

8

41

-120

22

6

41

-107

16

13

41

-117

20

9

43

-127

28

1

43

-125

24

4

45

-120

22

6

45

-126

26

2

45

-128

29

0

47

-125

24

4

47

-126

26

2

428

428


 

Таблица №15 «Число последовательностей и инверсий результативного признака».

29

28

6

23

29

45

2

27

31

-38

23

5

32

57

0

29

32

-26

16

11

33

-26

16

11

33

49

1

28

35

-38

23

5

35

14

7

22

35

-51

26

3

36

-25

14

14

37

10

9

19

38

-27

19

9

39

-62

27

2

39

-16

11

17

39

-30

21

7

40

-88

28

1

40

-46

25

4

41

-23

13

16

41

-26

16

11

41

-90

29

0

41

31

4

24

41

11

8

21

43

10

9

19

43

-27

19

4

45

-25

14

6

45

-30

21

9

45

31

4

24

47

38

3

26

47

-16

11

17

425

414


 

Подставляя полученные значения в  формулу, получим:

 

 

 

 

 

Задача 10.

 

 Постройте уравнения регрессии Y(X), Z(X) графическим

способом.

 

При построении линии регрессии  на корреляционном поле

проводят линию регрессии  с помощью линейки, «на глаз» – по

местам «сгущения» точек. Отдельные точки, далеко отстоящие  от

«облака рассеяния» (аномальные данные), игнорируют.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 11.

 

     С помощью метода  наименьших квадратов (МНК) построить  уравнения регрессии Y(X), Z(X). Нанести линии регрессии на корреляционное поле.

Методика решения

   Построение парной линейной  регрессии по МНК сводится  к решению системы нормальных  уравнений. Уравнение однофакторной  парной линейной связи имеет  вид:

Для того чтобы найти уравнение регрессии, нужно решить систему уравнений:

 Параметры уравнения находят  методом наименьших квадратов: 

  ;     

Составим вспомогательную таблицу.

Таблица №16.

29

-82

28

-2378

812

841

31

-86

45

-2666

1395

961

32

-89

-38

-2848

-1216

1024

33

-93

57

-3069

1881

1089

32

-88

-26

-2816

-832

1024

35

-92

-26

-3220

-910

1225

33

-89

49

-2937

1617

1089

29

-87

-38

-2523

-1102

841

35

-93

14

-3255

490

1225

37

-98

-51

-3626

-1887

1369

36

-97

-25

-3492

-900

1296

38

-97

10

-3686

380

1444

39

-100

-27

-3900

-1053

1521

35

-105

-62

-3675

-2170

1225

39

-100

-16

-3900

-624

1521

39

-101

-30

-3939

-1170

1521

41

-111

-88

-4551

-3608

1681

41

-108

-46

-4428

-1886

1681

41

-109

-23

-4469

-943

1681

41

-118

-26

-4838

-1066

1681

40

-120

-90

-4800

-3600

1600

40

-107

31

-4280

1240

1600

41

-117

11

-4797

451

1681

45

-127

10

-5715

450

2025

45

-125

-27

-5625

-1215

2025

43

-120

-25

-5160

-1075

1849

47

-126

-30

-5922

-1410

2209

47

-128

31

-6016

1457

2209

43

-125

38

-5375

1634

1849

45

-126

-16

-5670

-720

2025


Найдем коэффициенты a и b для уравнения регрессии Y(X).

 

Подставляя найденные коэффициента, запишем уравнение регрессии  Y(X):

Найдем коэффициенты a и b для уравнения регрессии Z(X).

 

Подставляя найденные коэффициента, запишем уравнение регрессии  Y(X):

 

Нанесем линии регрессии на корреляционное поле Y(X), Z(X).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 12.

 

     После определения коэффициентов корреляции и построения уравнения регрессии разными способами провести сравнение полученных оценок и построенных графиков.

Методика решения

     Если вычисления сделаны  правильно, то результаты, полученные  разными способами, должны совпадать  с некоторым приемлемым уровнем погрешности.

     В задаче 10 при построении корреляционного поля Z(X) было видно, что отсутствует взаимосвязь, поэтому линия регрессии проходит горизонтально: при изменении значения фактора результат в среднем остается постоянным.

     Коэффициент линейной корреляции можно приблизительно оценить по виду диаграммы рассеяния. Знак коэффициента корреляции совпадает со знаком коэффициента регрессии и определяет наклон линии, т.е. общую направленность зависимости (возрастание или убывание).       Абсолютная величина коэффициента корреляции определяется степенью близости точек к линии регрессии.

Сравнивая графики, начерченные в  задаче 10- Y(X) и Z(X)- c рисунком, приведенным ниже, видно, что

 

 

 

 

 

 

 

 

 

Задача 13.

 

     Провести сглаживание  ряда динамики с помощью простой и взвешенной скользящей средней, а также скользящей медианы по трем, пяти и двенадцати точкам. В качестве номера месяца t используется столбец N. Построить графики исходного ряда динамики (ИРД) и сглаженных рядов:

1) ИРД, ССП(3), ССП(5), ССП(12);

2) ИРД, ССВ(3), ССВ(5), ССВ(12);

3) ИРД, СМ(3), СМ(5), СМ(12);

Методика решения

     Ряд динамики – последовательность значений показателя во времени, в хронологическом порядке. Отдельное значение ряда называется уровнем.

Обычно выделяют три компонента ряда динамики: тренд, сезонные колебания  и случайную составляющую. Для  выделения основной тенденции используют скользящую среднюю или скользящую медиану.

     Скользящая средняя – среднее значение за интервал фиксированной длины, причем начало интервала сдвигается по времени. Определяют среднее значение по нескольким точкам и «привязывают» его к середине интервала. Затем начало интервала сдвигают на один шаг по времени вправо.

Информация о работе Методы описательной статистики