Лекция по "Статистике"

Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 23:34, лекция

Описание работы

Исходным понятием статистики является понятие статистической совокупности, под которой понимают массовое явление, изучаемое в данный момент статистикой (например: население страны). Каждая статистическая совокупность состоит из отдельных элементов, которые называют единицами статистической совокупности (для населения – человек, семья, население какого-нибудь региона, национальность и т. д.). Каждая единица совокупности обладает определенными свойствами. Признаком в статистике называют свойство или качество единицы совокупности, которое может быть определено или измерено (для человека – пол, рост, возраст, вес и т. д.). Признаки подразделяются на количественные и качественные (атрибутивные).

Файлы: 1 файл

Lektsii.doc

— 854.50 Кб (Скачать файл)

Различают виды корреляционной зависимости между признаками:

  • парная корреляция, при которой изучается зависимость одного результативного признака от одного факторного признака или связь между двумя факторными признаками
  • частная корреляция, при которой изучается зависимость одного результативного признака от одного факторного признака, при фиксированном значении других факторных признаков
  • множественная корреляция, при которой изучается зависимость одного результативного признака от двух и более факторных признаков

Связи между признаками классифицируются по аналитическому выражению, направлению  и степени тесноты. По аналитическому выражению различают линейную и нелинейную связь. Связь линейная. Если он может быть выражена с помощью линейной функции , в противном случае связь считается нелинейной. По направлению связи различают прямую и обратную связь. Прямая связь, при которой с увеличением (уменьшением) значений факторного признака, значения результативного признака увеличиваются (уменьшаются). В случае обратной связи между признаками, значение результативного признака изменяется под воздействием факторного в противоположном направлении. Степень тесноты связи между признаками изучается с помощью величины корреляционного отношения – [ ].  , где - межгрупповая дисперсия, - общая дисперсия; ; =1 – сильная связь между признаками; =0 – отсутствие связи.

В случае линейной зависимости между  двумя признаками вместо корреляционного  отношения вычисляют линейный коэффициент  корреляции [r].

; ; где - средняя величина факторного признака; - средняя величина результативного признака; (n – число пар значений); и - среднее квадратическое отклонение в ряду факторного и результативного признаков; b – параметр линейной функции, выражающий зависимость результативного признака от факторного.

: - прямая связь между признаками; - обратная связь. В зависимости от величины линейного коэффициента корреляции различают следующие виды связи между признаками:

значение

комментарий

 

связь отсутствует

 

связь слабая

связь умеренная

связь сильная


Параметр “b” – показывает на сколько, в среднем, изменяется значение результативного признака при изменении факторного признака на 1 единицу.

Пример: По имеющимся данным составим уравнение линейной функции, выражающее зависимость среднемесячной заработной платы от уровня производительности труда в 5 отраслях промышленности  в РФ за 2002 год:

Отрасль промышленности

Уровень производительности труда (млн. руб. на 1 работника), Х

Размер среднемесячной зарплаты (тыс. руб.), Y

Х2

ХY

Y2

Электроэнергетика

0.916

7,49

0,839

6,86

56,1001

Топливная

1,450

12,70

2,1025

18,415

161,29

Черная металлургия

0,684

5,92

0,468

4,049

35,0464

Цветная металлургия

0,780

9,48

0,6084

7,3944

89,8704

Машиностроение

0,322

4,18

0,104

1,346

17,4724

Итого:

4,152

39,77

4,1219

38,0644

359,7793


Для определения параметров a и b линейной функции, составляют систему уравнений:

; ; a=1,74; b=7,48; ; y=1,74+7,48х; ; ; ; r=0,93 – связь очень сильная и прямая.

В некоторых случаях для определения  степени тесноты связи между  двумя признаками  вычисляют ранговые коэффициенты связи Спирмена и Кендалла. Ранжирование – процедура упорядочения объектов изучения в порядке возрастания или убывания количественных значений. Коэффициент корреляции рангов (коэффициент Спирмена):

, где  - квадрат разности рангов; n – число наблюдений (число пар рангов).

Пример:

Отрасли промышленности

X

Y

Rx

Px

di

Электроэнергетика

0,916

7,49

4

3

1

1

Топливная

1,450

12,70

5

5

0

0

Черная М.

0,684

5,92

2

2

0

0

Цветная М.

0,780

9,48

3

4

-1

1

Машиностроение

0,322

4,18

1

1

0

0

Итого:

         

2


  1. Значения факторного признака ранжируют и ранги по Х записывают строго в порядке возрастания количественных значений.
  2. Значения результативного признака записывают строго в порядке возрастания.
  3. Находят разность рангов: .
  4. Полученные разности возводят в квадрат и рассчитывают их сумму.

 

Лекция №13.

Для вычисления коэффициента Кендалла значения факторного признака предварительно ранжируют, то есть ранги по Х записывают строго в порядке возрастания количественных значений.

Отрасли промышленности

X

Y

Rx

Px

P

Q

Машиностроение

0,322

4,18

1

1

4

0

Черная М.

0,684

5,92

2

2

3

0

Цветная М.

0,780

9,48

3

4

1

1

Электроэнергетика

0,916

7,49

4

3

1

0

Топливная

1,450

12,70

5

5

10

0

Итого:

       

+9

-1


  1. Для каждого ранга по Y находят общее количество следующих за ним рангов, больших по значению, чем данный ранг. Общее количество таких случаев учитывают со знаком “+” и обозначают P.
  2. Для каждого ранга по Y определяют количество следующих за ним рангов, меньших по значению, чем данный ранг. Общее количество таких случаев учитывают со знаком “-” и обозначают Q.
  3. Рассчитывают S=P+Q=9+(-1)=8
  4. Коэффициент Кенделла  вычисляют по формуле:

Коэффициент Кенделла может принимать  значения от -1 до +1 и чем ближе к , тем сильнее связь между признаками.

В некоторых случаях для определения  направления связи между двумя  признаками вычисляют коэффициент Фехнера. Этот коэффициент основан на сравнении поведения отклонений индивидуальных значений факторного и результативного признаков от своей средней величины. Коэффициент Фехнера вычисляют по формуле:

; где сумма С – общее  число совпадений знаков отклонений, сумма Н – общее число несовпадений  знаков отклонений.

 

Отрасли промышленности

X

Y

Электроэнергетика

0,916

7,49

+

-

Топливная

1,450

12,70

+

+

Черная М.

0,684

5,92

-

-

Цветная М.

0,780

9,48

-

+

Машиностроение

0,322

4,18

-

-


  1. Вычисляют среднюю величину факторного признака:
  2. Определяют знаки отклонений индивидуальных значений факторного признака от средней величины.
  3. Рассчитывают среднюю величину результативного признака: .
  4. Находят знаки отклонений индивидуальных значений результативного признака от средней величины:

Вывод: связь прямая, о тесноте связи коэффициент не говорит.

Для определения степени тесноты  связи между тремя ранжированными признаками вычисляют коэффициент конкордации. Он рассчитывается по формуле:

, где m – число ранжированных признаков; n – число ранжированных единиц наблюдения.

Отрасли промышленности

X1

X2

X3

R1

R2

R3

Электроэнергетика

970

669

7,49

4

3

3

10

1

Топливная

774

1122

12,70

3

4

5

12

9

Черная М.

690

472

5,92

2

2

2

6

9

Цветная М.

569

444

9,48

1

1

4

6

9

Машиностроение

3495

1126

4,18

5

5

1

11

4

Итог:

           

45

32


X1 – число работников (тыс. чел.); X2 – объем промышленных продаж (млрд. руб.); X3 – среднемесячная зарплата.

  1. Значения всех признаков ранжируем и ранги устанавливаем строго в порядке возрастания количественных значений.
  2. По каждой строке определяют сумму рангов. По этому столбцу вычисляется итоговая строка.
  3. Вычисляют .
  4. По каждой строке находят квадраты отклонений сумм рангов и величин Т. По этому же столбцу рассчитаем итоговую строку, которую обозначим через S. Коэффициент конкордации может принимать значения от 0 до 1 и чем ближе к 1, тем сильнее связь между признаками.

Изучение степени тесноты  между двумя качественными признаками.

Для определения  степени тесноты  связи между двумя качественными  признаками вычисляют коэффициенты ассоциации и контингенции по формулам:

; .

Для вычисления этих коэффициентов  строится таблица сопряженности, которая  характеризует связь между двумя  качественными признаками, каждый из которых является альтернативным.

a

b

a+b

c

d

c+d

a+c

b+d

a+b+c+d


Пример: Определить степень тесноты связи между успешной сдачей экзамена по статистике и посещаемостью занятий по этой же дисциплине:

Группы Студентов

Число студентов (чел.)

Из них:

Успешно сдали:

Не удовлетворительно:

Посещающие  занятия 

19

16 (a)

3 (b)

Не посещающие занятия

7

2 (c)

5 (d)


;

Связь между двумя качественными  признаками считается значимой, если коэффициент  , а .


Информация о работе Лекция по "Статистике"