Методика корреляционного анализа

Автор работы: Пользователь скрыл имя, 23 Октября 2013 в 17:10, контрольная работа

Описание работы

Возникновение статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками. Примером статистической связи является зависимость урожайности от количества внесенных удобрений, производительности труда на предприятии от его энерговооруженности и т.п. Конечно для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат.

Содержание работы

Введение. 1
1. Понятие и виды корреляционной связи. 2
2. Анализ сущности изучаемого явления, проверка однородности первичной информации. 4
3. Установление факта наличия и направление корреляционной зависимости. 5
4. Оценка существенности корреляционной связи. 10
5. Множественная корреляционная зависимость. 12
6. Использование функций Excel при проведении корреляционного анализа. 14
Заключение. 20
Список литературы. 20

Файлы: 1 файл

129 -корреляция.docx

— 267.35 Кб (Скачать файл)

Методика корреляционного анализа

Оглавление

Введение. 1

1. Понятие и виды корреляционной связи. 2

2. Анализ сущности изучаемого явления, проверка однородности первичной информации. 4

3. Установление факта наличия и направление корреляционной зависимости. 5

4. Оценка существенности корреляционной связи. 10

5. Множественная корреляционная зависимость. 12

6. Использование функций Excel при проведении корреляционного анализа. 14

Заключение. 20

Список литературы. 20

 

Введение.

Диалектический подход к  изучению природы и общества требует  рассмотрения явлений в их взаимосвязи  и непрестанном изменении.

Понятие корреляции появилось  в середине XIX в. благодаря работам английских статистиков Ф.Гальтона и К.Пирсона. Термин произошел от латинского “correlation” – соотношение, взаимосвязь.

В естественных науках часто  речь идет о функциональной зависимости (связи), когда каждому значению одной  переменной соответствует вполне определенное значение другой. Функциональная зависимость  может иметь место как между детерминированными (неслучайными) переменными (например зависимость скорости падения в вакууме от времени), так и между случайными величинами (например зависимость стоимости проданных изделий от их числа).

         В экономике в большинстве  случаев между переменными величинами  существуют зависимости, когда  каждому значению одной переменной  соответствует не какое-то определенное, а множество возможных значений  другой переменной. Иначе говоря, каждому значению одной переменной  соответствует определенное (условное) распределение другой переменной. Такая зависимость (связь) получила  название статистической.

        Возникновение  статистической связи обусловливается  тем, что зависимая переменная  подвержена влиянию ряда неконтролируемых  или неучтенных факторов, а также  тем, что измерение значений  переменных неизбежно сопровождается  некоторыми случайными ошибками. Примером статистической связи  является зависимость урожайности  от количества внесенных удобрений,  производительности труда на  предприятии от его энерговооруженности  и т.п. Конечно для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.

В данной работе мы рассмотрим понятие корреляции и порядок  проведения корреляционного анализа.

  1. Понятие и виды корреляционной связи.

 Изучить, насколько изменение одного показателя зависит от изменения другого – одна из важнейших задач статистики. Статистическая зависимость между двумя переменными, при которой каждому значению одной переменной соответствует определенное среднее значение, т.е. условное математическое ожидание другой, называется корреляционной. Иначе корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Корреляционная зависимость  проявляется лишь на основе массового  наблюдения.

Основными задачами при изучении корреляционных зависимостей являются: 
- выявление наличия (или отсутствие) связи; 
- отыскание формы связи в виде математической формулы, выражающей эту зависимость;

- измерение тесноты такой  зависимости.

В зависимости от направления  связи бывают прямыми (положительными), когда зависимая переменная возрастает с увеличением факторного признака, и обратными (отрицательными), когда  рост факторного признака сопровождается уменьшением функции.

В зависимости от своей  аналитической формы связи бывают линейными (между признаками в среднем  проявляются линейные отношения) и  нелинейными (переменные связаны между  собой нелинейно, например параболической, экспонциальной, гиперболической и другой зависимостью).

Важной является характеристика связей с точки зрения количества взаимодействующих факторов. Если изучается  связь двух признаков, то ее принято  называть парной; если изучается зависимость  между системами признаков (предполагается, что хотя бы в одной из систем число признаков больше двух), связь  принято называть множественной.

В зависимости от полноты  охвата системы взаимосвязанных  признаков корреляционные связи  делятся:

- на полные, учитывающие  связь как непосредственную в  данной паре признаков, так  и опосредованную влиянием прочих  признаков системы;

- частные, т.е. непосредственные  для данной пары признаков;

- ложные.

Для полной связи характерно участие какой-то третьей переменной (одной или нескольких), которая опосредует дополнительную связь между двумя изучаемыми признаками. В случае частной связи изучается взаимодействие признаков с исключенным влиянием «посредников». Ложная связь – это связь, установленная формально и подтвержденная только количественными оценками; она не имеет под собой качественной основы или вообще бессмысленна.

В зависимости от степени (силы, тесноты) различаются связи  слабые и сильные. Это формальная характеристика выражается конкретными  величинами и интерпретируется в  соответствии с общепринятыми критериями связи для конкретных показателей.

  1. Анализ сущности изучаемого явления, проверка однородности первичной информации.

В ходе проведения анализа  сущности изучаемого явления необходимо установить результативный показатель (у) и факторы его изменения, характеризуемые  показателями (х1, х2, х3,…).

Важнейшими условиями  правильного применения методов корреляционного анализа являются: достаточное число наблюдений, однородность тех единиц, которые подвергаются изучению, распределение исследуемых признаков-факторов в соответствии с законом нормального распределения.

Для оценки однородности совокупности используется коэффициент вариации по факторным признакам - ν = σ/Х ср * 100,

где σ- среднее квадратическое отклонение признака-фактора;

      Х ср – среднее значение признака фактора.

Совокупность считается  однородной, если коэффициент вариации не превышает 33%.

Проверка нормальности распределения  исследуемых факторных признаков  может выполняться по правилу  «трех сигм».

При использовании правила  «трех сигм» результаты проверки на нормальность распределения следует  представлять в табличной форме (табл.1).

Таблица 1

Интервалы значений признака-фактора

Число единиц, входящих в  интервал

Уд.вес единиц, входящих в интервал, в общем их числе, %

Уд.вес единиц, входящих в интервал, при нормальном распределении,%

1

2

3

4

     

68.36

     

95.4

     

99.7


 

Сопоставление данных граф 2 и 3 позволяет судить о наличии  или об отсутствии нормальности распределения. На практике часто встречаются случаи отклонения от этих двух предпосылок  – однородности совокупности и нормальности распределения. Однако это не означает, что следует отказаться от применения корреляционного анализа.

Если значения единиц входящих в совокупность не попадают в интервал:

 

То эти значения исключаются  из совокупности и формируется новый массив для последующего анализа.

  1. Установление  факта наличия и направление  корреляционной зависимости.

Для установления наличия  корреляционной связи используется ряд специфических методов : параллельное сопоставление рядов результативного и факторного признака, графическое изображение фактических данных с помощью поля корреляции, построение корреляционной таблицы, построение групповой таблицы.

Сопоставление двух параллельных рядов – простейший метод обнаружения  связи. Значения факторного признака располагают  в возрастающем порядке в первом ряду; во втором ряду записывают соответствующие  значения результативного признака (т.е. значения, относящиеся к той  же единице); затем прослеживается направление  изменения результативного признака.

Корреляционное поле –  точечный график, для построения которого по масштабной оси абцисс откладываются значения факторного признака х, а по масштабной оси ординат – значения результативного признака у. Каждой единице изучаемой совокупности на графике соответствует одна точка, положение которой определяется величиной двух признаков, характеризующих эту единицу. По расположению точек судят о наличии связи или ее отсутствии. Если точки разбросаны по всему полю – связи нет.

Визуальный анализ корреляционного  поля позволяет сделать предположение  о форме взаимосвязи двух исследуемых  показателей( рис. 1).


Рис.1. Корреляционное поле

Визуально анализируя корреляционное поле на рисунке 1, можно заметить, что оно как бы вытянуто вдоль какой-либо прямой линии. Такая картина характерна для так называемой линейной корреляционной взаимосвязи между признаками.

Наряду с этим примером из множества других возможных корреляционных полей можно выделить следующие (рис.2-3):

 

Рис. 2. Виды корреляционного  поля

Рис.3. Вид корреляционного  поля.

На рисунке 2-1 тоже просматривается линейная взаимосвязь, но с увеличением значений одного признака, уменьшаются значения другого, и наоборот, т.е. связь обратная или отрицательная. Можно предположить, что на рисунке 3 точки корреляционного поля разбросаны около какой-то кривой линии. В таком случае говорят, что между признаками существует криволинейная корреляционная связь.

В отношении корреляционного  поля, изображенного на рисунке 2-2, нельзя сказать, что точки располагаются вдоль какой-то прямой или кривой линии, оно имеет сферическую форму. В этом случае говорят, что признаки Х и Y не зависят друг от друга.

Кроме этого по корреляционному  полю можно примерно судить о тесноте  корреляционной связи, если эта связь  существует. Здесь говорят: чем меньше точки разбросаны около воображаемой усредненной линии, тем теснее корреляционная связь между рассматриваемыми признаками.

Визуальный анализ корреляционных полей помогает разобраться в  сущности корреляционной взаимосвязи, позволяет высказать предположение  о наличии, направленности и тесноте  связи. Но точно сказать, имеется  связь между признаками или нет, линейная связь или криволинейная, тесная связь (достоверная) или слабая (недостоверная), с помощью этого  метода нельзя. Наиболее точным методом  выявления и оценки линейной взаимосвязи  между признаками является метод  определения различных корреляционных показателей по статистическим данным.

В тех случаях, когда количество единиц, входящих в изучаемую совокупность, относительно велико, возникает необходимость  сведения данных в особую таблицу, которая  называется корреляционной таблицей. Для построения корреляционной таблицы  проводится группировка значений факторного и результативного признака при  одинаковом числе групп. В таблице  факторный признак х располагают в строках, а результативный признак у – в столбцах (графах) таблицы. В клетки, образованные пересечением строк и столбцов таблицы, записываются частоты повторения данного сочетания значений х и у. Если частоты расположены в клетках по диагонали из верхнего угла в правый нижний угол, то можно предполагать о наличии прямой корреляционной зависимости между признаками. Если частоты расположены в клетках по диагонали справа налево, то предполагают наличие обратной связи.

Пример корреляционной таблицы  представлен ниже:

Таблица 2.

Корреляционная таблица

Y

X

30

35

40

45

50

55

ny

45

4

2

       

6

55

 

5

3

     

8

65

   

5

45

5

 

55

75

   

7

8

2

 

17

85

     

4

3

7

14

nx

4

7

15

57

10

7

 

Информация о работе Методика корреляционного анализа