Статистическая обработка результатов исследования

Автор работы: Пользователь скрыл имя, 19 Декабря 2012 в 16:11, курсовая работа

Описание работы

Стати́стика — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.Слово «статистика» происходит от латинского status — состояние дел. В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Статистику», положив тем самым начало развитию статистики как науки и учебной дисциплины.

Содержание работы

1. Проверка статистической гипотезы о виде неизвестного распределения..3
2. Определение корреляционной зависимости между рядами наблюдений..13
Заключение………………………………………………………………………19

Файлы: 1 файл

Смолин.Никита.docx

— 298.48 Кб (Скачать файл)

 

по заданному уровню значимости α=0,05 и числу степеней свободы 

r=k-s=7-3=4; s - число связей, накладываемых на расчет теоретического распределения. При проверке гипотезы о нормальном распределении s = 3.

Найдем хи-критическое по таблице:

                                                       =9,490

 

 

Критическое значение сравниваем с расчетным :

                                                            <

 Вывод: нулевая гипотеза принимается с уровнем значимости α=0,05.

7. Выдвинуть гипотезы  об асимметрии и эксцессе кривой  распределения.

Нулевая гипотеза Н0 об асимметрии:

H0={А=0}

Нулевая гипотеза Н0 об эксцессе:

H0={Е=0}

Оценка  асимметрии кривой распределения

                                           

=-0,22762/(0,9951713) = - 0,23095

-Среднеквадратическое отклонение оценки асимметии

0,24495.

На уровне α=2*НОРМСТРАСП(0,23095/0,24495)-1= 0,6542 ноль попадает в двусторонний доверительный интервал с центром в А .Это уровень, на котором гипотеза H0={А=0}не отвергается.

 

Оценка эксцесса кривой распределения

=2,3011/(0,9951714)-3= - 0,65392

Среднеквадратическое отклонение оценки эксцесса

 

0,4899

На уровне α=2*НОРМСТРАСП(0,65392/0,4899)-1= 0,818ноль попадает в двусторонний доверительный интервал с центром в Е .Это уровень, на котором гипотеза H0={А=0}не отвергается. Вывод по первой части курсовой работы: Гипотеза о том , что выборка сделана из нормально распределенной случайной величины:Не отвергается

Покритерию:Пирсона,Колмогорова.Следствия из этой гипотезы, что коэффициент: Асимметрии равен 0,  отвергается;Эксцесса равен 0. 

 

2 Определение корреляционной  зависимости между

рядами  наблюдений

Таблица 1 - Результаты измерений случайных величин Х и Y

i

хi

yi

1

7,7

5,5

2

9,9

6,5

3

9,2

7

4

8,1

4,5

5

6,3

2,5

6

3

3,5

7

3,5

2,5

8

8,1

6

9

7,2

7

10

5,7

5,5

11

6,2

5

12

8,5

5

13

6,5

6,5

14

2

2

15

5,3

5

16

9,2

5

17

5,2

2,5

18

7,4

4

19

5,4

3

20

8,2

5,5


 

1. График зависимости  переменных X и Y (поле корреляции) строится в прямоугольной системе координат. На оси абсцисс откладываются значения факторного признака Х, а по оси ординат – результативного признака - Y.

2. На основании поля  корреляции сделать предположение  о наличии между случайными  величинами X и Y корреляционной зависимости и о форме этой зависимости (линейная или нелинейная).

                            Рисунок 1- Поле корреляции.

3. Вычислить оценки математических  ожиданий случайных величин X и Y

Оценка математического  ожидания случайной величины X (среднее арифметическое).

=6.63

Оценка математического  ожидания случайной величины Y (среднее арифметическое).

=4.7

 

4. Вычислить оценки средних  квадратических отклонений и

Оценка среднего квадратического отклонения случайной величины X

=2.1418

Оценка среднего квадратического отклонения случайной величины Y

=1.5845

5. Вычислить оценку коэффициента  корреляции между X и Y и определить его значимость и надежность;

Оценка коэффициента корреляции (выборочный коэффициент корреляции).

=0.67523

Таблица 2 – Вспомогательная  таблица регрессионного анализа

i

xi

yi

(xi-x)2

(yi-y)2



(xi-x)(yi-y)

|(yi-Yi)/yi|


1

7,7

5,5

1,07

0,8

1,1449

0,64

0,856

5,2345

 

4,548272727


2

9,9

6,5

3,27

1,8

10,6929

3,24

5,886

6,3334

5,525630769

3

9,2

7

2,57

2,3

6,6049

5,29

5,911

5,9837

6,145185714

4

8,1

4,5

1,47

-0,2

2,1609

0,04

-0,294

5,4343

3,292377778

5

6,3

2,5

-0,33

-2,2

0,1089

4,84

0,726

4,5352

0,68592

6

3

3,5

-3,63

-1,2

13,1769

1,44

4,356

2,8868

2,6752

7

3,5

2,5

-3,13

-2,2

9,7969

4,84

6,886

3,1365

1,2454

                   
             

Продолжение табл.2

   

8

8,1

6

1,47

1,3

2,1609

1,69

1,911

5,4343

5,094283333

9

7,2

7

0,57

2,3

0,3249

5,29

1,311

4,9847

6,2879

10

5,7

5,5

-0,93

0,8

0,8649

0,64

-0,744

4,2355

4,729909091

11

6,2

5

-0,43

0,3

0,1849

0,09

-0,129

4,4852

4,10296

12

8,5

5

1,87

0,3

3,4969

0,09

0,561

5,6341

3,87318

13

6,5

6,5

-0,13

1,8

0,0169

3,24

-0,234

4,6351

5,786907692

14

2

2

-4,63

-2,7

21,4369

7,29

12,501

2,3873

0,80635

15

5,3

5

-1,33

0,3

1,7689

0,09

-0,399

4,0356

4,19288

16

9,2

5

2,57

0,3

6,6049

0,09

0,771

5,9837

3,80326

17

5,2

2,5

-1,43

-2,2

2,0449

4,84

3,146

3,9857

0,90572

18

7,4

4

0,77

-0,7

0,5929

0,49

-0,539

5,0846

2,72885

19

5,4

3

-1,23

-1,7

1,5129

2,89

2,091

4,0856

1,638133333

20

8,2

5,5

1,57

0,8

2,4649

0,64

1,256

5,4842

4,502872727


 

 

 

6. Определить параметры  уравнения прямой регрессии  по формулам

=0.49951

=1.3882

Нанести прямую регрессии на график поля корреляции.

7. Оценить качество уравнения  регрессии с помощью средней  ошибки аппроксимации, характеризующей  различие между фактическим значением  и расчетным по уравнению регрессии

=24,48%

Качество уравнения регрессии  нельзя считать хорошим, так как ошибка аппроксимации превышает 8-10 %.

8. Степень тесноты связи  между переменными можно оценить  по величине коэффициента корреляции (шкала Шедока): 0,5<r<0,75- связь средняя.

9. Так как исходные  данные являются выборочными,  необходимо оценить значимость  величины коэффициента корреляции. Для этого выдвинем нулевую  гипотезу о незначимости коэффициента  корреляции.

H0={r=0}

Для проверки нулевой гипотезы использовать t-критерий Стьюдента. Расчетное значение t-критерия

=3.8838

Критическое значение критерия tкр =2.1 из таблицы распределения Стьюдента при уровне значимости α=0,05 и числу степеней свободы v = 18.

tрасч > tкр, нулевая гипотеза отклоняется и коэффициент корреляции значим.

Таблица 3-Дополненная корреляционная таблица.

i

xi

yi

Yi

(yi-Yi)2

1

7,9

5,5

5,28

0,046837

2

10,1

6,5

6,38

0,014182

3

9,4

7

6,03

0,937488

4

8,3

4,5

5,48

0,966476

5

6,5

2,5

4,59

4,348389

6

3

3,5

2,84

0,436226

7

3,5

2,5

3,09

0,346826

8

8,1

6

5,38

0,380272

9

7,2

7

4,93

4,266581

10

5,7

5,5

4,19

1,72594

11

6,2

5

4,44

0,318499

12

8,5

5

5,58

0,339717

13

6,5

6,5

4,59

3,666156

14

2

2

2,34

0,116103

15

5,3

5

3,99

1,026706

16

9,4

5

6,03

1,064529

17

5,4

2,5

4,04

2,361182

18

7,6

4

5,13

1,28583

19

5,6

3

4,14

1,291339

20

8,4

5,5

5,53

0,001087

 

134,6

94

94

24,94037

Средние

6,73

4,7

4,7

1,247018


 

Статистическая значимость коэффициента регрессии также проверяется  с использованием t-критерий Стьюдента, при этом расчетное значение критерия

=2.9392

где =0.1699

Сравнивая tрасч > tкр, нулевая гипотеза отклоняется и коэффициент корреляции значим.

 

10. Статистическая надежность  линейного уравнения регрессии  проверяется с использованием  критерия F-Фишера. Расчетное значение F-критерия находится по формуле

=15.0842

Критическое значение критерия Fкр =3,59153 из таблицы распределения Фишерадента при уровне значимости α=0,05 и числу степеней свободы и   k= 2 и k2=17 , k – число параметров при переменных Х.

 Fрасч > Fкр, уравнение регрессии статистически значимое или надежное.

Вывод:

На уровне значимости α=0,05:Между переменными х и у существует статистически значимая связь линейного вида Yx= 1.3882+ 0.49951, теснота связи средняя, коэффициент корреляции положителен, коэффициент при х значим. Ее можно использовать для предсказания значений Y при иных значениях Х.

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

1)С помощью этой  работы я научился группировать несгруппированный статистический ряд, вычислять оценки числовых характеристик(мат.ожидание,дисперсия,ско), выдвигать и проверять гипотезы об асимметрии и эксцессе с помощью критериев Колмогорова и Пирсона.

2)Построил график зависимости (точечную диаграмму) по которой подобрал модель уравнения регрессии.

3)Рассчитал параметры уравнения регрессии методом наименьших квадратов. 

4)Оценил качество уравнения с помощью средней ошибки аппроксимации.

5) Оценил по величине коэффициента корреляции (шкала Шедока) степень тесноты связи .

6)Оценил качество коэффициента корреляции и регрессии с помощью критерия Стьюдента.

7) Проверил надежность линейного уравнения регрессии с использованием критерия F-Фишера

 

 

 

 

 

 

 

 

 

Список использованных источников

1. В.Е. Гмурман. Теория вероятностей и математическая статистика. Изд. 7-е. Год выпуска: 2001. Издательство: Высшая школа, Количество страниц: 400 .

2. Методические указания к выполнению курсового проекта по дисциплине

«Вероятность и статистика» .

 

 

 

 

 


Информация о работе Статистическая обработка результатов исследования