Подставив rв в =(х – ): = rв.
[22]
Отсюда = rв
[23]
то уравнение регрессии Y по
Х имеет вид = rв(х
– )
[24]
Аналогично уравнение регрессии
Х по Y: = rв(y–
[25]
Выборочный коэффициент корреляции
определяется равенством:
rв=, где и – варианты признаков
Х и Y; частота пары вариант
(х, у); n – объем выборки; , – выборочные средние квадратические
отклонения; – выборочные средние.
Если величины Y и Х независимы,
то r=0; если r=1 и r= –1, то У и Х связаны линейной
функциональной зависимостью. Коэффициент
корреляции измеряет силу (тесноту) линейной
связи между Y и Х. Выборочный коэффициент
корреляции является оценкой коэффициента
корреляции генеральной совокупности
и поэтому также служит для измерения
линейной связи между величинами – количественными
признаками Y и Х.
Если выборка имеет достаточно
большой объем и хорошо представляет генеральную
совокупность, то заключение о тесноте
линейной зависимости между признаками,
полученные по данным выборки, может быть
распространено и на генеральную совокупность.
Рассмотрим 2 вспомогательные таблицы:
Табл.№6 Умножение частоты nij на условную
варианту U:
|
U |
|
|
V |
-2 |
-1 |
0 |
1 |
2 |
3 |
U |
v*U |
-2 |
-4 |
-4 |
0 |
0 |
0 |
0 |
-8 |
16 |
-1 |
0 |
-6 |
0 |
0 |
0 |
0 |
-6 |
6 |
0 |
0 |
0 |
0 |
45 |
8 |
0 |
53 |
0 |
1 |
0 |
0 |
0 |
8 |
12 |
0 |
20 |
20 |
2 |
0 |
0 |
0 |
4 |
14 |
9 |
27 |
54 |
|
|
|
|
|
|
|
сумма |
96 |
Табл.№7 Умножение частоты
на условную варианту V:
|
U |
|
V |
-2 |
-1 |
0 |
1 |
2 |
3 |
|
-2 |
-4 |
-8 |
0 |
0 |
0 |
0 |
|
-1 |
0 |
-6 |
-3 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
1 |
0 |
0 |
2 |
8 |
6 |
0 |
|
2 |
0 |
0 |
0 |
8 |
14 |
6 |
|
V |
-4 |
-14 |
-1 |
16 |
20 |
6 |
сумма |
u*V |
8 |
14 |
0 |
16 |
40 |
18 |
96 |
Вычислим выборочные характеристики
случайных величин Х, переходя к условным
вариантам
Табл.№8
Ui |
Ni |
Ui*ni |
Ui^2*ni |
-2 |
2 |
-4 |
8 |
-1 |
10 |
-10 |
10 |
0 |
11 |
0 |
0 |
1 |
57 |
57 |
57 |
2 |
17 |
34 |
68 |
3 |
3 |
9 |
27 |
сумма |
100 |
86 |
170 |
По таблице находим =0,86, =1,7, тогда 0,98
Табл.№9
Vi |
Ni |
Vi*ni |
Vi^2*ni |
-2 |
6 |
-12 |
24 |
-1 |
9 |
-9 |
9 |
0 |
55 |
0 |
0 |
1 |
16 |
16 |
16 |
2 |
14 |
28 |
56 |
Сумма |
100 |
23 |
105 |
По таблице находим = 0,23, = 1,05, тогда 0,998549
Тогда выборочный коэффициент
корреляции по формуле [21] rв=0,778885
Выборочное корреляционное
отношение
Выборочным корреляционным
отношением Y к Х называют отношение межгруппового
среднего квадратического отклонения
к общему среднему квадрати-ческому отклонению
признака Y:
= или *ух=
[26]
Здесь
, где n – объем выборки; частота значения
х признака Х; частота значения
у признака Y; общая средняя признака
Y; условная средняя
признака У.
Аналогично определяется выборочное
корреляционное отношение Х к Y:
=
[27]
Составим две расчетных таблицы
для вычисления выборочного корреляционного
отношения:
Табл.№10
) |
25 |
) |
31 |
) |
44,0909 |
) |
47,807 |
) |
56,7647 |
) |
65 |
|
47,3 |
|
0,79007 |
|
9,98549 |
Табл.№11
|
15,3333 |
|
18,6667 |
|
26,8182 |
|
28,25 |
|
31,6429 |
|
26,3 |
|
0,41488 |
|
4,9 |
Выборочное корреляционное
отношение для 0,07912, а для 0,08467
По формуле [23] 1,587255;
0,43308;
Коэффициенты 5,555185, 5,815316; тогда
уравнение прямой линии среднеквадратичной
регрессии Y на Х имеет вид – =1,5873х+5,5552, а уравнение прямой линии
среднеквадратичной регрессии Х на Y имеет
вид – =0,3822у+8,2215
Вывод: т.к. rв=0,778885, то связь между переменными
Х и Y прямая (r>0) и сильная. При увеличении x на единицу, у в среднем увеличится
на 1,5873. При увеличении y на 1, x в среднем увеличиться
на 0,4331.
Доверительные интервалы
для коэффициентов регрессии.
Проверка значимости выборочного
коэффициента корреляции:
Пусть имеется двумерная генеральная
совокупность (Х, У) с нормальным распределением.
Из нее извлечена выборка объема n и найден
выборочный коэффициент rв≠0. Требуется проверить гипотезу
Но: rг=0 о равенстве нулю генерального
коэффициента корреляции при конкурирующей
гипотезе Н1: rг≠0.
Если Но отвергается,
т.е. rв значимо отличается от нуля,
то Х и У коррелированны, т.е. между ними
существует линейная зависимость. Если
Но подтверждается,
т.е. rв не значимо отличается от нуля,
тогда Х и У не коррелированны и между
ними отсутствует линейная связь.
Для проверки Но используется
случайная величина =rв ,
[28]
имеющая распределение Стьюдента
с k=n-2 степенями свободы. Критическое значение
=t(α, к), находится из таблицы приложения
№6 по заданным α и к для двухсторонней
критической области.
Если |Т|<, то нет оснований
отвергнуть гипотезу Но.
Если ||>, то Но отвергают.
Если rв значим, то для генеральных
коэффициентов регрессии и справедливы
доверительные интервалы.
- Регрессия Y по Х
[29]
Где и – исправленные
выборочные средние квадратические отклонения, *ух – выборочный коэффициент
регрессии Y по Х.
- Регрессия Х по Y
[30]
По данным задачи по формуле
[28] =12,2943, (0,05;98)=1,99,
то Но отвергают,
так как ||>, тогда rв значимо отличается
от нуля и Х и У коррелированны, т.е. между
ними существует линейная зависимость.
Следовательно, справедливы
доверительные интервалы для регрессии
Y по Х:
1,3303361,844174, а для регрессии
Х по Y: 0,3712140,494946
Заключение
В первой задаче по проведенному
статистическому исследованию мы можем
сделать вывод о контрольных размерах
валиков во всей контролируемой партии
валиков, т.е. в генеральной совокупности.
Мы проверили гипотезу о нормальном распределении
генеральной совокупности по критерию
Пирсона. По данным задачи вычислили 2,8141 и =9,5. Так как (2,8141<9,5), то
критерий Пирсона выполняется. Следовательно,
доказали что, контрольные обмеры валиков
имеют нормальное распределение, вычислили
их числовые характеристики.
Во второй задаче вычислили
корреляционную зависимость распределения
100 предприятий по капиталовложениям Х
(млн. руб.) и выпуску продукции Y (млн. руб.).
Вычислили коэффициент регрессии rв=0,778885 и проверили его значимость.
Доказали, что rв значимо отличается
от нуля, тогда Х и Y коррелированны, т.е.
между ними существует линейная зависимость.
Нашли уравнение прямой линии среднеквадратичной
регрессии Y на Х, имеющий вид – =1,5873х+5,5552,
и уравнение прямой линии среднеквадратичной
регрессии Х на Y: =0,4331у+5,8153. Статистическая обработка данных
показала, что связь между переменными
Х и Y прямая и сильная.
Список использованной литературы
- В.Е. Гмурман «Теория вероятностей и математическая
статистика» 1998 г.
- В.Е. Гмурман «Руководство к решению задач по теории вероятностей и математической статистике» 2001 г.
- Н.Ш. Кремер «Теория вероятностей и математическая
статистика» 2009 г.