Факторный анализ. Метод главных компонент

Автор работы: Пользователь скрыл имя, 26 Июня 2015 в 22:13, курсовая работа

Описание работы

Наличие множества исходных признаков, характеризующих процесс функционирования объектов, заставляет отбирать из них наиболее существенные и изучать меньший набор показателей. Чаще исходные признаки подвергаются некоторому преобразованию, которое обеспечивает минимальную потерю информации. Такое решение может быть обеспечено методами снижения размерности, куда относят факторный и компонентный анализ

Содержание работы

Введение 3
1 Факторный анализ
1.1 Цели, типы и этапы факторного анализа 4
1.2 Пример проведения факторного анализа 6
2 Метод главных компонент
2.1 Краткие теоретические сведения 8
2.2 Вычисление главных компонент 10
Заключение 17
Список использованных источников 18

Файлы: 1 файл

Эконометрика.docx

— 178.82 Кб (Скачать файл)

 

 

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ Российской Федерации

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«ТЮМЕНСКИЙ государственный НЕФТЕГАЗОВЫЙ университет»

Институт менеджмента и бизнеса

Кафедра бизнес-информатики и математики

 

 

 

 

 

 

КУРСОВАЯ РАБОТА

 

по курсу: Эконометрика

на тему: Факторный анализ. Метод главных компонент

 

 

 

 

 

 

 

 

Выполнил: ст. гр.
Руководитель:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тюмень,2015

 

 

 

СОДЕРЖАНИЕ

 

 

Введение 3

1 Факторный анализ

         1.1 Цели, типы  и этапы факторного анализа 4

         1.2 Пример проведения факторного анализа 6

2 Метод главных компонент

2.1 Краткие теоретические сведения 8

2.2 Вычисление главных компонент 10

Заключение 17

Список использованных источников 18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Наличие множества исходных признаков, характеризующих процесс функционирования объектов, заставляет отбирать из них наиболее существенные и изучать меньший набор показателей. Чаще исходные признаки подвергаются некоторому преобразованию, которое обеспечивает минимальную потерю информации. Такое решение может быть обеспечено методами снижения размерности, куда относят факторный и компонентный анализ. Эти методы позволяют учитывать эффект существенной многомерности данных, дают возможность лаконичного или более простого объяснения многомерных структур. Они вскрывают объективно существующие, непосредственно не наблюдаемые закономерности при помощи полученных факторов или главных компонент. Они дают возможность достаточно просто и точно описать наблюдаемые исходные данные, структуру и характер взаимосвязей между ними. Сжатие информации получается за счет того, что число факторов или главных компонент – новых единиц измерения – используется значительно меньше, чем было исходных признаков.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. ФАКТОРНЫЙ АНАЛИЗ

 

    1. Цели, типы  и этапы факторного анализа

 

К примеру, анализируя оценки, полученные по нескольким шкалам, исследователь отмечает, что они сходны между собой и имеют высокий коэффициент корреляции, в этом случае он может предположить, что существует некоторая латентная переменная, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором, который влияет на многочисленные показатели других переменных, что приводит к возможности и необходимости отметить его как наиболее общий, более высокого порядка.

Таким образом, можно выделить две цели факторного анализа:

  • определение взаимосвязей между переменными, их классификация, т. е. «объективная R-классификация»;
  • сокращение числа переменных.

Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов. Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство данного метода также в том, что он – единственный математически обоснованный метод факторного анализа.

Факторный анализ – методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя.

Типы факторного анализа

Существуют следующие типы факторного анализа:

1) Детерминированный (функциональный) – результативный показатель  представлен в виде произведения, частного или алгебраической  суммы факторов.

2) Стохастический (корреляционный) – связь между результативным и факторными показателями является неполной или вероятностной.

3) Прямой (дедуктивный) – от общего к частному.

4) Обратный (индуктивный) – от частного к общему.

5) Одноступенчатый и многоступенчатый.

6) Статический и динамический.

7) Ретроспективный и перспективный.

Также факторный анализ может быть разведочным – он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках и конфирматорным, предназначенным для проверки гипотез о числе факторов и их нагрузках. Практическое выполнение факторного анализа начинается с проверки его условий.

Обязательные условия факторного анализа:

  • Все признаки должны быть количественными;
  • Число признаков должно быть в два раза больше числа переменных;
  • Выборка должна быть однородна;
  • Исходные переменные должны быть распределены симметрично;
  • Факторный анализ осуществляется по коррелирующим переменным.

При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей.

Этапы факторного анализа

Как правило, факторный анализ проводится в несколько этапов.

Этапы факторного анализа:

1 этап. Отбор факторов.

2 этап. Классификация и систематизация  факторов.

3 этап. Моделирование взаимосвязей  между результативным и факторными показателями.

4 этап. Расчет влияния факторов  и оценка роли каждого из  них в изменении величины результативного  показателя.

5 этап. Практическое использование  факторной модели (подсчет резервов  прироста результативного показателя).

 

1.2 Пример проведения факторного анализа

 

Постройте факторную модель зависимости результативного показателя (объема продаж) от материальных затрат и материалоемкости продукции, используя исходные данные, приведенные в табл. 1.1. Укажите тип модели. Расчеты влияния факторов, связанных с использованием материальных ресурсов, выполните методом цепных подстановок.

Таблица 1.1 Исходные данные для проведения факторного анализа объема продаж.

 

 

Показатель

Условн. обозначение

Отчетный год

Предыдущий год

Изменение (+;-)

Чистая прибыль тыс.руб.

N

1 000

1 020

- 20

Материальные затраты тыс.руб.

M

460

510

- 50

Материалоемкость продукции руб.

Ym

0,46

0,5

- 0,04


 

Решение:

Рассмотрим простейшую двухфакторную мультипликативную модель вида :

М=N×Ym.

Алгоритм ее решения методом цепных подстановок:

В Отчетном году: M=460

В предыдущем году: M=510

УОподст.=1000×0,5=500→ 500-510= -10

У1подст.=1000×0,46=460→460-500= -40

Проверка:

460-510= -50

∑Уxi = -10+(-40)= -50

 

Вывод: материальные затраты в отчетном периоде снизились на 50 тыс.руб., за счет снижения чистой прибыли на 20 тыс.руб, материальные затраты понизились на 10 тыс.руб, а за счет понижения материалоемкости на 0,04 руб. материальные затраты так же снизились до 40 тыс.руб.

 

 

 

 

 

 

 

 

 

2.1 Краткие теоретические сведения

 

Решение задачи методом главных компонент сводится к поэтапному преобразованию матрицы исходных данных X (рисунок 2.1):

 

 

Рисунок 2.1 – Схема математических преобразований

 

На рисунке обозначено: X – матрица исходных данных размерностью n*m (n – число объектов наблюдения, m – число элементарных аналитических признаков); Z – матрица центрированных и нормированных значений признаков, элементы матрицы вычисляют по формуле: ; R – матрица парных корреляций: R = (1/n)*Z’*Z.

Если предварительная стандартизация данных не проводилась, то на данном шаге получают матрицу S = (1/n)*X’*X, элементы матрицы X для расчета будут центрированными величинами.

Опишем дальнейшие шаги вычислений для метода главных компонент и объясним математический смысл полученных результатов.

Λ – диагональная матрица собственных (характеристических) чисел.

Множество решений λj находят решением характеристического уравнения |R - λE| = 0. λj – это характеристики вариации, точнее, показатели дисперсии каждой главной компоненты. Суммарное значение Σλj равно сумме дисперсий элементарных признаков Xj. При условии стандартизации исходных данных, эта сумма равна числу элементарных признаков m.

Решив характеристическое уравнение, находят его корни λj. После этого вычисляют собственные векторы матрицы R. Реально это означает решение m систем линейных уравнений для каждого λj при j = 1..m. В общем виде система имеет вид:

 

 

Приведенная система объединяет однородные линейные уравнения, и так как число ее уравнений равно числу неизвестных, она имеет бесконечное множество решений. Конкретные значения собственных векторов при этом можно найти, задавая произвольно по крайней мере величину одной компоненты каждого вектора.

A – матрица факторного отображения, ее элементы arj – весовые коэффициенты. Вначале A имеет размерность m*m – по числу элементарных признаков Xj, затем в анализе остается r наиболее значимых компонент, r ≤ m. Вычисляют матрицу A по известным данным матрицы собственных чисел Λ и нормированных собственных векторов V по формуле A = VΛ1/2.

F – матрица значений главных компонент размерностью r*n, F = A-1Z’. Эта матрица в общем виде записывается:

 


 

 

                                                  

 

 

2.2 Вычисление  главных компонент

Первой главной компонентой Z1 исследуемой системы признаков Х1, Х2, Х3 , Х4 ,…, Хn называется такая центрировано – нормированная линейная комбинация этих признаков, которая среди прочих центрировано – нормированных линейных комбинаций этих признаков, имеет дисперсию наиболее изменчивую.

В качестве второй главной компоненты Z2 мы будем брать такую центрировано – нормированную комбинацию этих признаков, которая:

  1. не коррелированна с первой главной компонентой,
  2. среди всех возможных комбинаций исходных признаков, которые не

не коррелированны с  первой главной компонентой, эта комбинация имеет наибольшую дисперсию.

K-ой главной компонентой Zk (k=1…m) мы будем называть такую центрировано – нормированную комбинацию признаков, которая:

  1. не коррелированна с к-1 предыдущими главными компонентами,
  2. среди всех возможных комбинаций исходных признаков, которые не

не коррелированны с к-1 предыдущими главными компонентами, эта комбинация имеет наибольшую дисперсию.

      Введём ортогональную  матрицу U и перейдём от переменных Х к переменным Z, причём   

      Вектор  выбирается т. о., чтобы дисперсия была максимальной. После получения выбирается т. о., чтобы дисперсия была максимальной при условии, что не коррелированно с и т. д.

 

Так как признаки измерены в несопоставимых величинах, то удобнее будет перейти к центрированно-нормированным величинам. Матрицу исходных  центрированно-нормированных значений признаков найдем из соотношения:

,

 

где - несмещенная, состоятельная и эффективная оценка математического ожидания,

  -несмещенная, состоятельная и эффективная оценка дисперсии.

Центрирование и нормирование произведено с помощью программы"Stadia".

 

        Так как  признаки центрированы и нормированы, то оценку корреляционной матрицы можно произвести по формуле:

 

.

Перед тем как проводить компонентный анализ, проведем анализ независимости исходных признаков.

Проверка значимости матрицы парных корреляций с помощью критерия Уилкса.

Выдвигаем гипотезу:

   Н0: незначима

   Н1: значима

Строим статистику , распределена по закону с степенями свободы.

 =125,7; (0,05;3,3) = 7,8

т.к >  , то гипотеза Н0 отвергается и матрица является значимой, следовательно, имеет смысл проводить компонентный анализ.

      Проверим гипотезу о диагональности  ковариационной матрицы

 Выдвигаем гипотезу:

   Н0: соv =0,

   Н1: соv

Строим статистику , распределена по закону с степенями свободы.

=123,21, (0,05;10) =18,307 т.к > то гипотеза Н0 отвергается и имеет смысл проводить компонентный анализ.

  

        Для построения  матрицы факторных нагрузок необходимо  найти собственные числа матрицы , решив уравнение .

Используем для этой операции функцию eigenvals системы MathCAD, которая возвращает собственные числа матрицы:

Информация о работе Факторный анализ. Метод главных компонент