Корреляционный анализ

Автор работы: Пользователь скрыл имя, 18 Октября 2013 в 18:38, реферат

Описание работы

Корреляционный анализ – это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Коэффициент корреляции – двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных. Таким образом, корреляционный анализ это совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками.

Содержание работы

1. Введение………………………………………………………………….…3
2. Реферативная справка……………………………………………………...5
3. Отбор факторов для корреляционного анализа……………………..…...9
4. Постановка задачи………………………………………………………...11
5. Пример…………………………………………………………………..…12
6. Выводы………………………………………………………………….…19
7. Список использованной литературы………………………………….…20

Файлы: 1 файл

referat_po_kompam.docx

— 107.77 Кб (Скачать файл)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ  И НАУКИ РФ

Федеральное  государственное  бюджетное образовательное учреждение высшего профессионального образования

ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ  ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

 

Кафедра «ХТПЭ»

 

 

 

 

Реферат

Тема: Корреляционный анализ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Волгоград 2013

Содержание

  1. Введение………………………………………………………………….…3
  2. Реферативная справка……………………………………………………...5
  3. Отбор факторов для корреляционного анализа……………………..…...9
  4. Постановка задачи………………………………………………………...11
  5. Пример…………………………………………………………………..…12
  6. Выводы………………………………………………………………….…19
  7. Список использованной литературы………………………………….…20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Статистические методы применяются  при обработке материалов психологических  исследований для того, чтобы извлечь  из тех количественных данных, которые  получены в экспериментах, при опросе и наблюдениях, возможно больше полезной информации. Одним самых из распространенных методов статистики является корреляционный анализ.

Термин "корреляция" впервые  применил французский палеонтолог  Ж. Кювье, который вывел "закон  корреляции частей и органов животных" (этот закон позволяет восстанавливать  по найденным частям тела облик всего  животного). В статистику указанный  термин ввел английский биолог и статистик  Ф. Гальтон (не просто связь – relation, а "как бы связь " – corelation).

Корреляционный анализ –  это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Коэффициент  корреляции – двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных. Таким образом, корреляционный анализ это совокупность методов обнаружения  корреляционной зависимости между  случайными величинами или признаками. Корреляционный анализ для двух случайных  величин заключает в себе:

1) построение корреляционного поля и составление корреляционной таблицы;

2)   вычисление выборочных коэффициентов корреляции и корреляционных отношений;

3)  проверка статистической гипотезы значимости связи.

Основное назначение корреляционного  анализа – выявление корреляционной связи между двумя или более  изучаемыми переменными. Корреляционная связь это совместное согласованное изменение двух изучаемых характеристик. Данная изменчивость обладает тремя основными характеристиками: формой, направлением и силой.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Реферативная  справка

 

Корреляционный анализ  -    совокупность основанных на математической теории корреляции методов  обнаружения корреляционной зависимости  между двумя случайными признаками или факторами. Корреляционный анализ экспериментальных данных заключает в себе следующие основные практические приёмы: 1) построение корреляционного поля и составление корреляционной таблицы; 2) вычисление выборочных коэффициентов корреляции или корреляционного отношения; 3) проверка статистической гипотезы значимости связи. Дальнейшее исследование заключается в установлении конкретного вида зависимости между величинами. Зависимость между тремя и большим числом случайных признаков или факторов изучается методами многомерного корреляционного анализа. (вычисление частных и множественных коэффициентов корреляции и корреляционных отношений).

Корреляционное поле и  корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость выборочных точек получают корреляционное поле. По характеру  расположения точек поля можно составить  предварительное мнение о форме  зависимости случайных величин (например, о том, что одна величина в среднем  возрастает или убывает при возрастании  другой). Для численной обработки  результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке корреляционной таблицы  приводятся численности гц; тех пар (х, у), компоненты которых попадают в соответствующие интервалы  группировки по каждой переменной.

         Предполагая длины интервалов  группировки (по каждому из  переменных) равными между собой,  выбирают центры xi (соответственно yj) этих интервалов и числа  nij в качестве основы для расчётов.

         Коэффициент корреляции и корреляционное  отношение дают более точную  информацию о характере и силе  связи, чем картина корреляционного  поля. Выборочный коэффициента корреляции  определяют по формуле:

   Где

При большом числе независимых  наблюдений, подчиняющихся одному и  тому же распределению, и при надлежащем выборе интервалов группировки коэффициент  ρ̂ близок к истинному коэффициенту корреляции ρ. Поэтому использование  ρ̂ как меры связи имеет четко  определённый смысл для тех распределений, для которых естественной мерой  зависимости служит ρ (т. е. для нормальных или близких к ним распределений). Во всех др. случаях в качестве характеристики силы связи рекомендуется использовать корреляционное отношение η, интерпретация  которого не зависит от вида исследуемой  зависимости.

Коэффициенты корреляции является общепринятой в математической статистике характеристикой связи между  двумя случайными величинами. Коэффициент  корреляции - показатель степени взаимозависимости, статистической связи двух переменных; изменяется в пределах от -1 до +1. Значение коэффициента корреляции 0 указывает на возможное отсутствие зависимости, значение +1 свидетельствует о согласованности переменных.

Различают следующие коэффициенты корреляции:

- дихотомический - показатель связи  признаков (переменных) измеряемых  по дихотомическим шкалам наименований;

- Пирсона (Pearson product-moment correlation) - коэффициент  корреляции, используемый для континуальных  переменных;

- ранговой корреляции Спирмена (Spearmen's rank-order correlation) - коэффициент корреляции  для переменных, измеренных в  порядковых (ранговых) шкалах;

- точечно-бисериальной корреляции (point-biserial correlation) - коэффициент корреляции, применяемый в случае анализа  отношения переменных, одна из  которых измерена в континуальной  шкале, а другая - в строго дихотомической  шкале наименований;

- j - коэффициент корреляции, используемый  в случае, если обе переменные  измерены в дихотомической шкале  наименований.

- тетрахорический (четырехпольный) (tetrachoric) - коэффициент корреляции, используемый  в случае, если обе переменные  измерены в континуальных шкалах[4].

Линейная связь между переменными Xi и Xj оценивается коэффициентом  корреляции:

где Xi и Xj – исследуемые переменные; mXi и mXj – математические ожидания переменных; σX и σX – дисперсии переменных.

Выборочный коэффициент корреляции определяют по формуле:

или по преобразованной формуле:

где i =1, 2, ., n, j = 1, 2, ., m, u = 1, 2, ., N; N – число  опытов(объем выборки); xi, xj – оценки математических ожиданий; SXi, SXj – оценки среднеквадратических отклонений.

Только при совместной нормальной распределенности исследуемых случайных  величин Xi и Xj коэффициент корреляции имеет определенный смысл связи  между переменными. В противном  случае коэффициент корреляции может  только косвенно характеризовать эту  связь[5].

Применение корреляционного  анализа позволяет решить следующие  задачи:

1) определить изменение  результативного показателя под  воздействием одного или нескольких  факторов {в абсолютном измерении), т.е. определить, на сколько единиц  изменяется величина результативного  показателя при изменении факторного  на единицу;

2) установить относительную  степень зависимости результативного  показателя от каждого фактора.

Исследование корреляционных зависимостей имеет огромное значение в АХД. Это проявляется в том, что значительно углубляется  факторный анализ, устанавливаются  место и роль каждого фактора  в формировании уровня исследуемых  показателей, углубляются знания об изучаемых явлениях, определяются закономерности их развития и как итог — точнее обосновываются планы и управленческие решения, более объективно оцениваются итоги деятельности предприятий и более полно определяются внутрихозяйственные резервы.

 

Отбор факторов для  корреляционного анализа

 

Отбор факторов для корреляционного  анализа — очень важный момент: от того, насколько правильно отобраны факторы, зависят конечные результаты анализа. Главная роль при отборе факторов принадлежит теории, а также  практическому опыту анализа. При  этом необходимо придерживаться следующих  правил.

1. В первую очередь следует учитывать причинно-следственные связи между показателями, ибо только они раскрывают сущность изучаемых явлений. Анализ же таких факторов, которые находятся только в математических соотношениях с результативным показателем, не имеет практического смысла.

2. При создании многофакторной  корреляционной модели необходимо  отбирать самые значимые факторы,  которые оказывают решаюшее воздействие  на результативный показатель, так  как охватить все условия и  обстоятельства практически невозможно. Факторы, которые имеют критерий  надежности по Стьюденту меньше  табличного, не рекомендуется принимать  в расчет.

3. В корреляционную модель  линейного типа не рекомендуется  включать факторы, связь которых  с результативным показателем  имеет криволинейный характер.

4. Нельзя включать в  корреляционную модель взаимосвязанные  факторы. Если парный коэффициент  корреляции между двумя факторами  больше 0,85, то по правилам корреляционного  анализа один из них необходимо  исключить, иначе это приведет  к искажению результатов анализа.

5. Не рекомендуется включать  в корреляционную модель факторы,  связь которых с результативным  показателем носит функциональный  характер.

Большую помощь при отборе факторов для корреляционной модели оказывают аналитические группировки, способ сравнения параллельных и  динамических рядов, линейные графики. С их помощью можно определить наличие, направление и форму  зависимости между изучаемыми показателями. Отбор факторов можно производить  также в процессе решения задачи корреляционного анализа на основе оценки их значимости по критерию Стьюдента.

Учитывая перечисленные  требования и используя названные  способы отбора факторов, для многофакторной корреляционной модели уровня рентабельности (Y) подобраны следующие факторы, оказывающие наиболее существенное влияние на ее уровень:

x1 - материалоотдача, руб.;

x2 - фондоотдача, коп.;

x3 - производительность труда  (среднегодовая выработка продукции  на одного работника), млн руб.;

x4 - продолжительность оборота  оборотных средств предприятия,  дни;

x5 - удельный вес продукции  высшей категории качества, %.

Поскольку корреляционная связь  достаточно полно проявляется только в массе наблюдений, объем выборки  данных должен быть достаточно большим, так как только в массе наблюдений сглаживается влияние других факторов. Чем большая совокупность объектов исследуется, тем точнее результаты анализа.

 

 

 

 

 

 

Постановка задачи

Имеется матрица наблюдений вида(пример 1 ,2)

Необходимо определить оценки коэффициентов корреляции для всех или только для заданных пар параметров и оценить их значимость. Незначимые оценки приравниваются к нулю.

Допущения:

  • Выборка имеет достаточный объем. Понятие достаточного объема зависит от целей анализа, требуемой точности и надежности оценки коэффициентов корреляции, от количества факторов. Минимально допустимым считается объем, когда количество наблюдений не менее чем в 5–6 раз превосходит количество факторов;
  • выборки по каждому фактору являются однородными. Это допущение обеспечивает несмещенную оценку средних величин;
  • матрица наблюдений не содержит пропусков.

Если необходима проверка значимости оценки коэффициента корреляции, то требуется соблюдение дополнительного  условия – распределение вариант должно подчиняться нормальному закону.

Задача анализа решается в несколько этапов:

Информация о работе Корреляционный анализ