Автор работы: Пользователь скрыл имя, 15 Января 2013 в 13:30, курсовая работа
В курсовом проекте рассматриваются методы описательной статистики: группировка данных, построение статистических таблиц и графиков, а также вычисление основных статистических показателей.
Задачи в составе курсового проекта позволяют, освоить основные статистические методы. Для использования этих методов, требуется понимание соответствующих разделов общей теории статистики.
Расчеты в процессе курсового проектирования выполняются с помощью калькулятора, графики строятся на миллиметровой бумаге. Выполнение всех операций «вручную» позволяет получить глубокое понимание статистических методов и освоить практические навыки статистической обработки данных.
Вычислим средние значения
и
:
Линейный коэффициент
Т.к следовательно, линейная зависимость происходит на фоне отклонений.
Т.к то это слабая, несущественная линейная зависимость.
Задача 9.
Вычислить коэффициенты корреляции рангов Спирмена и Кендалла Y(X) и Z(X). Сделать вывод о тесноте связи.
Методика решения
Ранговый коэффициент корреляции характеризует общий характер нелинейной зависимости: возрастание или убывание результативного признака при возрастании факторного. Это показатель тесноты монотонной нелинейной связи.
Коэффициент корреляции рангов Спирмена:
где - разность рангов X и Y;
n – число наблюдений( число пар, число разностей рангов);
6 – число шесть (не путать с сигмой)
Для вычисления рангов коэффициентов исходные данные ранжируют, т.е. расставляют по порядку возрастания или убывания, а затем нумеруют. Ранг – это порядковый номер. Если встречается два одинаковых значения, им присваивают одинаковое значение ранга, равное среднему арифметическому рангов этих значений.
Таблица №13 « Коэффициент корреляции рангов Спирмена».
x |
y |
z |
|
|
|
|
|
|
|
29 |
-128 |
-90 |
1,5 |
1 |
1 |
0,5 |
0,5 |
0,25 |
0,25 |
29 |
-127 |
-88 |
1,5 |
2 |
2 |
-0,5 |
-0,5 |
0,25 |
0,25 |
31 |
-126 |
-62 |
3 |
3,5 |
3 |
-0,5 |
0 |
0,25 |
0 |
32 |
-126 |
-51 |
4,5 |
3,5 |
4 |
1 |
0,5 |
1 |
0,25 |
32 |
-125 |
-46 |
5 |
5,5 |
5 |
-0,5 |
0 |
0,25 |
0 |
33 |
-125 |
-38 |
6,5 |
5,5 |
6,5 |
1 |
0 |
1 |
0 |
33 |
-120 |
-38 |
6,5 |
7,5 |
6,5 |
-1 |
0 |
1 |
0 |
35 |
-120 |
-30 |
9 |
7,5 |
8,5 |
1,5 |
0,5 |
2,25 |
0,25 |
35 |
-118 |
-30 |
9 |
9 |
8,5 |
0 |
0,5 |
0 |
0,25 |
35 |
-117 |
-27 |
9 |
10 |
10,5 |
-1 |
-1,5 |
1 |
2,25 |
36 |
-111 |
-27 |
11 |
11 |
10,5 |
0 |
0,5 |
0 |
0,25 |
37 |
-109 |
-26 |
12 |
12 |
13 |
0 |
-1 |
0 |
1 |
38 |
-108 |
-26 |
13 |
13 |
13 |
0 |
0 |
0 |
0 |
39 |
-107 |
-26 |
15 |
14 |
13 |
1 |
2 |
1 |
4 |
39 |
-105 |
-25 |
15 |
15 |
15,5 |
0 |
-0,5 |
0 |
0,25 |
39 |
-101 |
-25 |
15 |
16 |
15,5 |
-1 |
-0,5 |
1 |
0,25 |
40 |
-100 |
-23 |
17,5 |
17,5 |
17 |
0 |
0,5 |
0 |
0,25 |
40 |
-100 |
-16 |
17,5 |
17,5 |
18,5 |
0 |
-1 |
0 |
1 |
41 |
-98 |
-16 |
21 |
19 |
18,5 |
2 |
2,5 |
4 |
6,25 |
41 |
-97 |
10 |
21 |
20,5 |
20,5 |
0,5 |
0,5 |
0,25 |
0,25 |
41 |
-97 |
10 |
21 |
20,5 |
20,5 |
0,5 |
0,5 |
0,25 |
0,25 |
41 |
-93 |
11 |
21 |
22,5 |
22 |
-1,5 |
-1 |
2,25 |
1 |
41 |
-93 |
14 |
21 |
22,5 |
23 |
-1,5 |
-2 |
2,25 |
4 |
43 |
-92 |
28 |
24,5 |
24 |
24 |
0,5 |
0,5 |
0,25 |
0,25 |
43 |
-89 |
31 |
24,5 |
25,5 |
25,5 |
-1 |
-1 |
1 |
1 |
45 |
-89 |
31 |
27 |
25,5 |
25,5 |
1,5 |
1,5 |
2,25 |
2,25 |
45 |
-88 |
38 |
27 |
27 |
27 |
0 |
0 |
0 |
0 |
45 |
-87 |
45 |
27 |
28 |
28 |
-1 |
-1 |
1 |
1 |
47 |
-86 |
49 |
29,5 |
29 |
29 |
0,5 |
0,5 |
0,25 |
0,25 |
47 |
-82 |
57 |
29,5 |
30 |
30 |
-0,5 |
-0,5 |
0,25 |
0,25 |
Подставляем полученные значения в формулу, получим:
Ранговый коэффициент корреляции Кендалла:
где n – число наблюдений;
S=P-Q – разность сумм числа последовательностей и инверсий результативного признака.
В процессе вычислений факторный признак X упорядочивается по возрастанию с присвоением порядкового номера (ранжируется). Затем результативный признак Y упорядочивается по возрастанию факторного признака X.
Число последовательностей P для каждого ранга Y – это число следующих рангов, превышающих эту величину.
Число инверсий Q для каждого ранга Y – это число следующих рангов, меньших выбранного.
Таблица №14 «Число последовательностей и инверсий результативного признака».
|
|
||
29 |
-82 |
0 |
29 |
29 |
-86 |
1 |
28 |
31 |
-89 |
4 |
24 |
32 |
-93 |
7 |
21 |
32 |
-88 |
3 |
26 |
33 |
-92 |
6 |
23 |
33 |
-89 |
4 |
24 |
35 |
-87 |
2 |
27 |
35 |
-93 |
7 |
21 |
35 |
-98 |
11 |
18 |
36 |
-97 |
9 |
19 |
37 |
-97 |
9 |
19 |
38 |
-100 |
12 |
16 |
39 |
-105 |
15 |
14 |
39 |
-100 |
12 |
16 |
39 |
-101 |
14 |
15 |
40 |
-111 |
19 |
10 |
40 |
-108 |
17 |
12 |
41 |
-109 |
18 |
11 |
41 |
-118 |
21 |
8 |
41 |
-120 |
22 |
6 |
41 |
-107 |
16 |
13 |
41 |
-117 |
20 |
9 |
43 |
-127 |
28 |
1 |
43 |
-125 |
24 |
4 |
45 |
-120 |
22 |
6 |
45 |
-126 |
26 |
2 |
45 |
-128 |
29 |
0 |
47 |
-125 |
24 |
4 |
47 |
-126 |
26 |
2 |
428 |
428 |
Таблица №15 «Число последовательностей и инверсий результативного признака».
|
|
||
29 |
28 |
6 |
23 |
29 |
45 |
2 |
27 |
31 |
-38 |
23 |
5 |
32 |
57 |
0 |
29 |
32 |
-26 |
16 |
11 |
33 |
-26 |
16 |
11 |
33 |
49 |
1 |
28 |
35 |
-38 |
23 |
5 |
35 |
14 |
7 |
22 |
35 |
-51 |
26 |
3 |
36 |
-25 |
14 |
14 |
37 |
10 |
9 |
19 |
38 |
-27 |
19 |
9 |
39 |
-62 |
27 |
2 |
39 |
-16 |
11 |
17 |
39 |
-30 |
21 |
7 |
40 |
-88 |
28 |
1 |
40 |
-46 |
25 |
4 |
41 |
-23 |
13 |
16 |
41 |
-26 |
16 |
11 |
41 |
-90 |
29 |
0 |
41 |
31 |
4 |
24 |
41 |
11 |
8 |
21 |
43 |
10 |
9 |
19 |
43 |
-27 |
19 |
4 |
45 |
-25 |
14 |
6 |
45 |
-30 |
21 |
9 |
45 |
31 |
4 |
24 |
47 |
38 |
3 |
26 |
47 |
-16 |
11 |
17 |
425 |
414 |
Подставляя полученные значения в формулу, получим:
Постройте уравнения регрессии Y(X), Z(X) графическим
способом.
При построении линии регрессии на корреляционном поле
проводят линию регрессии с помощью линейки, «на глаз» – по
местам «сгущения» точек. Отдельные точки, далеко отстоящие от
«облака рассеяния» (аномальные данные), игнорируют.
Задача 11.
С помощью метода
наименьших квадратов (МНК)
Методика решения
Построение парной линейной
регрессии по МНК сводится
к решению системы нормальных
уравнений. Уравнение
Для того чтобы найти уравнение регрессии, нужно решить систему уравнений:
Параметры уравнения находят методом наименьших квадратов:
;
Составим вспомогательную
Таблица №16.
29 |
-82 |
28 |
-2378 |
812 |
841 |
31 |
-86 |
45 |
-2666 |
1395 |
961 |
32 |
-89 |
-38 |
-2848 |
-1216 |
1024 |
33 |
-93 |
57 |
-3069 |
1881 |
1089 |
32 |
-88 |
-26 |
-2816 |
-832 |
1024 |
35 |
-92 |
-26 |
-3220 |
-910 |
1225 |
33 |
-89 |
49 |
-2937 |
1617 |
1089 |
29 |
-87 |
-38 |
-2523 |
-1102 |
841 |
35 |
-93 |
14 |
-3255 |
490 |
1225 |
37 |
-98 |
-51 |
-3626 |
-1887 |
1369 |
36 |
-97 |
-25 |
-3492 |
-900 |
1296 |
38 |
-97 |
10 |
-3686 |
380 |
1444 |
39 |
-100 |
-27 |
-3900 |
-1053 |
1521 |
35 |
-105 |
-62 |
-3675 |
-2170 |
1225 |
39 |
-100 |
-16 |
-3900 |
-624 |
1521 |
39 |
-101 |
-30 |
-3939 |
-1170 |
1521 |
41 |
-111 |
-88 |
-4551 |
-3608 |
1681 |
41 |
-108 |
-46 |
-4428 |
-1886 |
1681 |
41 |
-109 |
-23 |
-4469 |
-943 |
1681 |
41 |
-118 |
-26 |
-4838 |
-1066 |
1681 |
40 |
-120 |
-90 |
-4800 |
-3600 |
1600 |
40 |
-107 |
31 |
-4280 |
1240 |
1600 |
41 |
-117 |
11 |
-4797 |
451 |
1681 |
45 |
-127 |
10 |
-5715 |
450 |
2025 |
45 |
-125 |
-27 |
-5625 |
-1215 |
2025 |
43 |
-120 |
-25 |
-5160 |
-1075 |
1849 |
47 |
-126 |
-30 |
-5922 |
-1410 |
2209 |
47 |
-128 |
31 |
-6016 |
1457 |
2209 |
43 |
-125 |
38 |
-5375 |
1634 |
1849 |
45 |
-126 |
-16 |
-5670 |
-720 |
2025 |
Найдем коэффициенты a и b для уравнения регрессии Y(X).
Подставляя найденные
Найдем коэффициенты a и b для уравнения регрессии Z(X).
Подставляя найденные
Нанесем линии регрессии на корреляционное поле Y(X), Z(X).
Задача 12.
После определения коэффициентов корреляции и построения уравнения регрессии разными способами провести сравнение полученных оценок и построенных графиков.
Методика решения
Если вычисления сделаны
правильно, то результаты, полученные
разными способами, должны
В задаче 10 при построении корреляционного поля Z(X) было видно, что отсутствует взаимосвязь, поэтому линия регрессии проходит горизонтально: при изменении значения фактора результат в среднем остается постоянным.
Коэффициент линейной корреляции можно приблизительно оценить по виду диаграммы рассеяния. Знак коэффициента корреляции совпадает со знаком коэффициента регрессии и определяет наклон линии, т.е. общую направленность зависимости (возрастание или убывание). Абсолютная величина коэффициента корреляции определяется степенью близости точек к линии регрессии.
Сравнивая графики, начерченные в задаче 10- Y(X) и Z(X)- c рисунком, приведенным ниже, видно, что
Задача 13.
Провести сглаживание ряда динамики с помощью простой и взвешенной скользящей средней, а также скользящей медианы по трем, пяти и двенадцати точкам. В качестве номера месяца t используется столбец N. Построить графики исходного ряда динамики (ИРД) и сглаженных рядов:
1) ИРД, ССП(3), ССП(5), ССП(12);
2) ИРД, ССВ(3), ССВ(5), ССВ(12);
3) ИРД, СМ(3), СМ(5), СМ(12);
Методика решения
Ряд динамики – последовательность значений показателя во времени, в хронологическом порядке. Отдельное значение ряда называется уровнем.
Обычно выделяют три компонента ряда динамики: тренд, сезонные колебания и случайную составляющую. Для выделения основной тенденции используют скользящую среднюю или скользящую медиану.
Скользящая средняя – среднее значение за интервал фиксированной длины, причем начало интервала сдвигается по времени. Определяют среднее значение по нескольким точкам и «привязывают» его к середине интервала. Затем начало интервала сдвигают на один шаг по времени вправо.