Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 23:34, лекция
Исходным понятием статистики является понятие статистической совокупности, под которой понимают массовое явление, изучаемое в данный момент статистикой (например: население страны). Каждая статистическая совокупность состоит из отдельных элементов, которые называют единицами статистической совокупности (для населения – человек, семья, население какого-нибудь региона, национальность и т. д.). Каждая единица совокупности обладает определенными свойствами. Признаком в статистике называют свойство или качество единицы совокупности, которое может быть определено или измерено (для человека – пол, рост, возраст, вес и т. д.). Признаки подразделяются на количественные и качественные (атрибутивные).
Различают виды корреляционной зависимости между признаками:
Связи между признаками классифицируются по аналитическому выражению, направлению и степени тесноты. По аналитическому выражению различают линейную и нелинейную связь. Связь линейная. Если он может быть выражена с помощью линейной функции , в противном случае связь считается нелинейной. По направлению связи различают прямую и обратную связь. Прямая связь, при которой с увеличением (уменьшением) значений факторного признака, значения результативного признака увеличиваются (уменьшаются). В случае обратной связи между признаками, значение результативного признака изменяется под воздействием факторного в противоположном направлении. Степень тесноты связи между признаками изучается с помощью величины корреляционного отношения – [ ]. , где - межгрупповая дисперсия, - общая дисперсия; ; =1 – сильная связь между признаками; =0 – отсутствие связи.
В случае линейной зависимости между двумя признаками вместо корреляционного отношения вычисляют линейный коэффициент корреляции [r].
; ; где - средняя величина факторного признака; - средняя величина результативного признака; (n – число пар значений); и - среднее квадратическое отклонение в ряду факторного и результативного признаков; b – параметр линейной функции, выражающий зависимость результативного признака от факторного.
: - прямая связь между признаками; - обратная связь. В зависимости от величины линейного коэффициента корреляции различают следующие виды связи между признаками:
значение |
комментарий |
|
связь отсутствует |
|
связь слабая |
связь умеренная | |
связь сильная |
Параметр “b” – показывает на сколько, в среднем, изменяется значение результативного признака при изменении факторного признака на 1 единицу.
Пример: По имеющимся данным составим уравнение линейной функции, выражающее зависимость среднемесячной заработной платы от уровня производительности труда в 5 отраслях промышленности в РФ за 2002 год:
Отрасль промышленности |
Уровень производительности труда (млн. руб. на 1 работника), Х |
Размер среднемесячной зарплаты (тыс. руб.), Y |
Х2 |
ХY |
Y2 |
Электроэнергетика |
0.916 |
7,49 |
0,839 |
6,86 |
56,1001 |
Топливная |
1,450 |
12,70 |
2,1025 |
18,415 |
161,29 |
Черная металлургия |
0,684 |
5,92 |
0,468 |
4,049 |
35,0464 |
Цветная металлургия |
0,780 |
9,48 |
0,6084 |
7,3944 |
89,8704 |
Машиностроение |
0,322 |
4,18 |
0,104 |
1,346 |
17,4724 |
Итого: |
4,152 |
39,77 |
4,1219 |
38,0644 |
359,7793 |
Для определения параметров a и b линейной функции, составляют систему уравнений:
; ; a=1,74; b=7,48; ; y=1,74+7,48х; ; ; ; r=0,93 – связь очень сильная и прямая.
В некоторых случаях для
, где - квадрат разности рангов; n – число наблюдений (число пар рангов).
Пример:
Отрасли промышленности |
X |
Y |
Rx |
Px |
di |
|
Электроэнергетика |
0,916 |
7,49 |
4 |
3 |
1 |
1 |
Топливная |
1,450 |
12,70 |
5 |
5 |
0 |
0 |
Черная М. |
0,684 |
5,92 |
2 |
2 |
0 |
0 |
Цветная М. |
0,780 |
9,48 |
3 |
4 |
-1 |
1 |
Машиностроение |
0,322 |
4,18 |
1 |
1 |
0 |
0 |
Итого: |
2 |
Лекция №13.
Для вычисления коэффициента Кендалла значения факторного признака предварительно ранжируют, то есть ранги по Х записывают строго в порядке возрастания количественных значений.
Отрасли промышленности |
X |
Y |
Rx |
Px |
P |
Q |
Машиностроение |
0,322 |
4,18 |
1 |
1 |
4 |
0 |
Черная М. |
0,684 |
5,92 |
2 |
2 |
3 |
0 |
Цветная М. |
0,780 |
9,48 |
3 |
4 |
1 |
1 |
Электроэнергетика |
0,916 |
7,49 |
4 |
3 |
1 |
0 |
Топливная |
1,450 |
12,70 |
5 |
5 |
10 |
0 |
Итого: |
+9 |
-1 |
Коэффициент Кенделла может принимать значения от -1 до +1 и чем ближе к , тем сильнее связь между признаками.
В некоторых случаях для
; где сумма С – общее
число совпадений знаков
Отрасли промышленности |
X |
Y |
||
Электроэнергетика |
0,916 |
7,49 |
+ |
- |
Топливная |
1,450 |
12,70 |
+ |
+ |
Черная М. |
0,684 |
5,92 |
- |
- |
Цветная М. |
0,780 |
9,48 |
- |
+ |
Машиностроение |
0,322 |
4,18 |
- |
- |
Вывод: связь прямая, о тесноте связи коэффициент не говорит.
Для определения степени тесноты
связи между тремя
, где m – число ранжированных признаков; n – число ранжированных единиц наблюдения.
Отрасли промышленности |
X1 |
X2 |
X3 |
R1 |
R2 |
R3 |
||
Электроэнергетика |
970 |
669 |
7,49 |
4 |
3 |
3 |
10 |
1 |
Топливная |
774 |
1122 |
12,70 |
3 |
4 |
5 |
12 |
9 |
Черная М. |
690 |
472 |
5,92 |
2 |
2 |
2 |
6 |
9 |
Цветная М. |
569 |
444 |
9,48 |
1 |
1 |
4 |
6 |
9 |
Машиностроение |
3495 |
1126 |
4,18 |
5 |
5 |
1 |
11 |
4 |
Итог: |
45 |
32 |
X1 – число работников (тыс. чел.); X2 – объем промышленных продаж (млрд. руб.); X3 – среднемесячная зарплата.
Изучение степени тесноты
между двумя качественными
Для определения степени тесноты
связи между двумя
; .
Для вычисления этих коэффициентов
строится таблица сопряженности, которая
характеризует связь между
a |
b |
a+b |
c |
d |
c+d |
a+c |
b+d |
a+b+c+d |
Пример: Определить степень тесноты связи между успешной сдачей экзамена по статистике и посещаемостью занятий по этой же дисциплине:
Группы Студентов Число студентов (чел.) |
Из них: | ||
Успешно сдали: |
Не удовлетворительно: | ||
Посещающие занятия |
19 |
16 (a) |
3 (b) |
Не посещающие занятия |
7 |
2 (c) |
5 (d) |
;
Связь между двумя качественными признаками считается значимой, если коэффициент , а .