Применение метода корреляции в анализе. Коэффициенты ассоциации и контингенции, коэффициенты Пирсона и Чупрова

Автор работы: Пользователь скрыл имя, 07 Января 2014 в 17:05, контрольная работа

Описание работы

Статистика - отрасль общественных наук, имеющая целью сбор, упорядочение, анализ и сопоставление фактов, относящихся к самым разнообразным массовым явлениям.
Статистика, как наука подразделяется на: теорию статистики, макроэкономическую статистику, экономическую статистику, отраслевую статистику.
Каждая отрасль имеет свою статистику. Статистика развивается как отдельная наука. Отраслевая статистика дополняет теорию статистики.

Файлы: 1 файл

реферат1.docx

— 77.51 Кб (Скачать файл)

Коэффициент ассоциации принимает  значение «1», если хотя бы одна из клеток таблицы 2 х 2 равна нулю (таблица 2 и таблица 3).  

 

Таблица 2 - Случай полной связи. Активность в профсоюзе и уровень заработной платы

Проявление активности

Уровень заработной платы

Итого

высокий

низкий

Высокая

-

50 (b)

50 (a+b)

Низкая

50 (c)

-

50 (c+d)

Итого

50 (a+c)

50 (b+d)

100


 

Таблица 3 - Случай неполной связи. Активность в профсоюзе и уровень заработной платы

Проявление активности

Уровень заработной платы

Итого

высокий

низкий

Высокая

25 (a)

-

25 (a+b)

Низкая

30 (c)

45(d)

75 (c+d)

Итого

55 (a+c)

45 (b+d)

100


 

Для таблицы 2: =-1, случай полной связи.

Для таблицы 3: =1, в случае неполной связи.

Эта особенность коэффициента ассоциации снижает его значение и показывает, насколько важно  соблюдать осторожность при интерпретации  результатов измерения связи.

Более достоверное измерение  связи обеспечивает коэффициент  контингенции:

 

 

Таблица 4 - Сравнительная таблица коэффициентов ассоциации и контингенции

Номер таблицы

Коэффициент ассоциации

Коэффициент контингенции

1

0,909

0,612

2

-1

-1

3

1

0,52


По данным табл.4 значение существенно ниже величины . Приведенные примеры подтверждают, что коэффициент контингенции является более достоверной мерой связи между дихотомическими переменными. Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона – Чупрова.

3.Коэффициенты взаимной сопряженности К.Пирсона и А.Чупрова

Для определения связи  между неколичественными признаками применяют непараметрический критерий хи-квадрат Пирсона для испытания гипотезы о независимости двух переменных

 

где mij- эмпирические,

m´ ij – теоретические,

где i=1…k1,

j=1… k2.

Число степеней свободы  ,

где k1 и k2 – число строк и столбцов.

 

Данные статистического наблюдения располагаются в таблице

 

       y

x

I

II

III

Всего

I

m11

m12

m13

mi

II

 

m22

 

mi

III

   

m33

mi

Всего

mj

mj

mj

m


 

С помощью коэффициента взаимной сопряженности находим  взаимосвязь между неколичественными  признаками через число совпадений.

Теоретические частоты  рассчитываются по каждой строке или  столбцу пропорционально общим  итогам исходя из гипотезы о случайности  распределения 

 

Если нулевая гипотеза об отсутствии связи отклоняется, , то необходимо измерить тесноту связи. Само значение критерия хи-квадрат в качестве меры связи не используется, хотя, конечно, большая величина хи-квадрата дает основание надеяться на то, что связь между переменными будет тесной. Но величина хи-квадрата зависит от числа наблюдений n, от распределения наблюдений по клеткам таблицы, т.е. от клеточных частот , а значит , и от числа категорий, выделяемых по одной переменной m и по другой переменной p, т.е. величина критерия хи-квадрат зависит от числа строк и столбцов таблицы. Поэтому измерение связи между категоризованными переменными проводится с помощью специальных мер связи. Для таблиц размерности m и p используют коэффициенты взаимной сопряженности. В эту группу показателей входят коэффициенты взаимной сопряженности К.Пирсона и А.Чупрова.

Коэффициент взаимной сопряженности Пирсона рассчитывается по формуле:

 

 

где i-номер категории по признаку x, i=1…m,

j-номер категории по признаку y, j=1…p, .

Коэффициент сопряженности Чупрова рассчитывается по формуле:

 

где k1 и k2 – число строк и столбцов в таблице.

- показатель взаимной  сопряженности, определяется как  сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки. Вычитая из этой суммы 1, получим величину показателя взаимной сопряженности.

 

Пример: Для определения связи между такими признаками, как федеральный округ и число турпакетов, реализованных населению за год (табл.5), рассчитаем коэффициенты взаимной сопряженности К.Пирсона и А.Чупрова.

 

 

 

 

Таблица 5 - Число турпакетов, реализованных населению по Федеральным округам за год

Федеральный округ

Число турпакетов, реализованных населению  за год, ед.

менее 30000

Менее 60000

60000 и более

итого

Центральный

15

1

2

18

Северо-Западный

7

4

0

11

Южный

4

0

2

6

Северокавказский

3

1

3

7

Приволжский

8

2

4

14

Уральский

3

2

1

6

Сибирский

6

3

3

12

Дальневосточный

6

0

3

9

Итого

52

13

18

83


 

 

Чем ближе  величины и к 1, тем сильнее связь.

 

 

По данным полученных коэффициентов, можно сказать, что связь между  рассматриваемыми показателями слабая. Значит число турпакетов, реализованных населению за год практически не зависит от федерального округа.

 

Практическая часть

Задание № 1

Даны продажи товара в магазинах условного города, 2010-2011 гг

Магазин

Цена, руб./шт

Продажи, тыс.шт.

 

2010

2011

2010

2011

E

720

800

6300

4770

G

750

840

8100

5670

I

675

750

1100

990

B

650

750

1350

1260


 

Рассчитать:

  1. Средние цены на товар по 4 магазинам за 2010 и 2011 год.
  2. Определить дисперсию, среднее квадратическое отклонение цен, коэффициент вариации по каждому товару.
  3. Оценить изменение средних цен и влияние на него отдельных факторов (индекс цен переменного состава, постоянного состава и структурных сдвигов).
  4. Оценить, насколько изменились средние цены в общем, а также под влиянием собственно роста цен, и изменения структуры продаж.
  5. Отобразить изменение структуры продаж на графике.

 

Решение:

Составим расчётную таблицу

Магазин

Цена, руб./шт.

Продажи, тыс.шт.

Товарооборот, тыс.руб.

2010

2011

2010

2011

2010

2011

Отчетный период по ценам базисного  периода

               

E

720

800

6300

4770

4536000

3816000

3434400

G

750

840

8100

5670

6075000

4762800

4252500

I

675

750

1100

990

742500

742500

668250

B

650

750

1350

1260

877500

945000

819000

 

698,75

785

16850

12690

12231000

10266300

9174150


 

  1. Средние цены на товар по 4 магазинам за 2010 и 2011 г.

Средняя цена рассчитывается по формуле:

 

 

 

Средняя цена товара за 2011 год увеличилась  на 86,25 рублей.

  1. Определить дисперсию, среднее квадратическое отклонение цен, коэффициент вариации по каждому товару
    1. Дисперсия

Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую:

 

Расчет дисперсии:

 

 

    1. Среднее квадратическое отклонение цен

Формула средней квадратической применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма: σ.

 

 

 

    1. Коэффициенты вариации

Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:

 

 

Критериальным значением квадратического коэффициента вариации служит 0,333 или 33,3%, то есть если меньше или равен 0,333 - вариация считает слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.

За 2010 год:

 

За 2011 год:

 

  1.  Оценить изменение средних цен и влияние на него отдельных факторов (индекс цен переменного состава, постоянного состава и структурных сдвигов)
    1. Изменение средних цен

 

 

И в абсолютной величине:

 

    1. Индекс цен переменного состава

Средняя цена по всем группам  зависит от средней цены на товар  по отдельным группам и доли физического  объема продаж в каждой из этих групп.

Таким образом, можно сказать, что средняя цена на товар по всем группам равна сумме произведений средней цены по группам (качественный показатель) на долю в физическом объеме соответствующей группы (количественный показатель).

Соответственно, индекс цен  переменного состава (индекс средних  величин) будет представлять собой  отношение:

 

За счет всех факторов цена возросла на 11,45%.

    1. Индекс цен постоянного состава

Чтобы определить влияние  только средней цены по разным группам  товара на изменение средней цены по всей совокупности в формуле индекса  цен переменного состава необходимо устранить влияние изменения  структуры физического объема.

Это достигается путем  фиксирования значения доли (количественный показатель) на отчетном уровне. Получаемый индекс называется индексом фиксированного (постоянного) состава и рассчитывается по формуле:

 

За счет изменения структуры  цены средняя цена возросла на 11,9%.

    1. Индекс цен структурных сдвигов

Индекс влияния изменения структуры продажи товара на динамику средней цены

 

 

За счет изменения структуры  продаж средняя цена снизилась на 0,4%.

Продажи снизились на 1%.

Информация о работе Применение метода корреляции в анализе. Коэффициенты ассоциации и контингенции, коэффициенты Пирсона и Чупрова