Метод главных компонент

Автор работы: Пользователь скрыл имя, 22 Сентября 2013 в 18:35, курсовая работа

Описание работы

Целью данной курсовой является рассмотрение метода главных компонент. В соответствии с поставленной целью необходимо выполнить следующие задачи:
1. Рассмотрение статистического подхода в методе главных компонент
2. Примеры использования главных компонент в экономике
3. Экономико-математическое моделирование факторов (на примере КР)

Содержание работы

Введение………………………………………………………………..……….3
Глава 1 Метод главных компонент. Определение. Задачи метода..............................................................................................................5
Глава 2 Статистический подход в методе главных компонент. Примеры использования главных компонент в экономике...........................9
Глава 3 Экономико-математическое моделирование факторов, определяющих уровень доступности жилья в Кыргызской Республике с помощью метода главных компонент…………………………………………11
ЗАКЛЮЧЕНИЕ…………………………………………………..…………….18
СПИСОК ЛИТЕРАТУРЫ………………………………...…………………..…20

Файлы: 1 файл

КУРСОВАЯ МЕТОД ГЛАВНЫХ.docx

— 101.18 Кб (Скачать файл)

Установим максимальное количество факторов равным пяти. Укажем на использование  матрицы корреляций, а не ковариаций, в силу разнородности исходных данных.

 

 

 

Для проведения анализа выберем  метод линейной регрессии, и укажем вывод матрицы нагрузок компонент  на исходные факторы. Также зададим  автоматическое сохранение полученных компонент.

 

Total Variance Explained

Component

Initial Eigenvalues

Extraction Sums of Squared Loadings

 

Total

% of Variance

Cumulative %

Total

% of Variance

Cumulative %

1

7,119

79,097

79,097

7,119

79,097

79,097

2

1,196

13,294

92,390

1,196

13,294

92,390

3

,685

7,610

100,000

,685

7,610

100,000

4

1,71E-016

1,90E-015

100,000

1,71E-016

1,90E-015

100,000

5

7,35E-017

8,16E-016

100,000

7,35E-017

8,16E-016

100,000

6

2,00E-017

2,22E-016

100,000

 

 

 

 

 

 

7

-1,39E-016

-1,54E-015

100,000

 

 

 

 

 

 

8

-2,89E-016

-3,21E-015

100,000

 

 

 

 

 

 

9

-4,11E-016

-4,57E-015

100,000

 

 

 

 

 

 

Extraction Method: Principal Component Analysis.

 

Видно, что первая компонента объясняет 79,1% дисперсии изучаемой  переменной, а вторая компонента – 13,3%, в совокупности первые две компоненты объясняют более 92,4% дисперсии анализируемого признака.

Следовательно, рассматривать  остальные компоненты не имеет смысла.

 

Рассмотрим матрицу нагрузок компонент на исходные факторы: 

Component Score Coefficient Matrix

 

Component

 

 

1

2

3

4

5

inv_cap

,092

-,623

-,198

6460109,170

14898963,679

build_w

,139

,102

,111

13292246,588

54603288,837

homes_a

,124

,248

-,521

15041240,437

-61453376,500

inc_p

,139

,058

,163

-55948348,537

1460054,226

CPI

-,112

,340

,652

3155695,450

4295961,230

workless

,105

,498

-,430

-1750634,689

38385425,993

aver_sal

,134

-,023

,447

-12747489,592

-62343884,121

GDP

,134

,031

,449

45696825,423

-10112035,701

pop_kg

,136

-,083

,316

-2802955,999

33901583,978


 

Extraction Method: Principal Component Analysis.

Component Scores.

Первая компонента раскладывается на следующую линейную комбинацию факторов:

Component1 = 0,092*inv_cap + 0,139*build_w + 0,124*homes_a + 0,139*inc_p – 0,112*CPI + 0,105*workless + 0,134*aver_sal + 0,134*GDP + 0,136*pop_kg

Этой компоненте трудно дать какую-либо содержательную экономическую  интерпретацию. Единственный вариант  – считать ее показателем общего уровня экономического развития страны.

Вторая компонента раскладывается на сумму исходных факторов следующим  образом:

Component2 = – 0,623*inv_cap + 0,102*build_w + 0,248*homes_a + 0,058*inc_p + 0,340*CPI + 0,498*workless – 0,023*aver_sal + 0,031*GDP – 0,083*pop_kg

Если отбросить факторы, с коэффициентами, довольно близкими к нулю и, следовательно, оказывающими малое влияние на изучаемый признак, то мы получим следующее разложение второй компоненты по факторам:

Component2 = – 0,623*inv_cap + 0,102*build_w + 0,248*homes_a + 0,340*CPI + 0,498*workless

Вторую компоненту, выраженную в этом виде, можно интерпретировать как общий уровень развития строительного  сектора в Кыргызстане.

 

 

 

 

 

Заключение

Подводя  итог всему выше сказанному  можно сказать о  том, что  наличие множества исходных признаков, характеризующих процесс  функционирования объектов, заставляет отбирать из них наиболее существенные и изучать меньший набор показателей. Чаще исходные признаки подвергаются некоторому преобразованию, которое  обеспечивает минимальную потерю информации. Такое решение может быть обеспечено методами снижения размерности, куда относят  факторный и компонентный анализ. Эти методы позволяют учитывать  эффект существенной многомерности  данных, дают возможность лаконичного  или более простого объяснения многомерных  структур. Они вскрывают объективно существующие, непосредственно не наблюдаемые  закономерности при помощи полученных факторов или главных компонент. Они дают возможность достаточно просто и точно описать наблюдаемые  исходные данные, структуру и характер взаимосвязей между ними. Сжатие информации получается за счет того, что число  факторов или главных компонент  – новых единиц измерения –  используется значительно меньше, чем  было исходных признаков.

На основании изученной  темы и проделанной работы по написанию  данного реферата  можно сделать  вывод, что поставленные цель и задачи нашли  здесь свое отражение.

Метод главных компонент  считается статистическим методом.

Учитывая, что объекты  исследования в экономике характеризуются  большим, но конечным количеством признаков (характеристик), влияние которых  подвергается воздействию большого количества случайных причин, в качестве моделей в статистическом плане  берутся многомерные распределения.

Из оптимальных свойств главных компонент следует, что они оказываются полезным статистическим инструментарием в задачах «автопрогоноза» большого числа анализируемых показателей по сравнительно малому числу вспомогательных переменных, визуализации многомерных данных, построение типообразуюших признаков; при типологизации многомерных объектов, при предварительном анализе геометрической и вероятностной природы массива исходных данных. К методу главных компонент обращаются и при построении различного рода регрессионных моделей.

В данной курсовой работе была построена математическая модель и  программная реализация метода главных компонент. Следует отметить, что в работе не была рассмотрена методика отсева несущественных факторов, и поэтому результирующая модель, выдаваемая программой на экран, содержит число компонент, равное числу исходных элементарных признаков m. К достоинствам разработанной программы можно отнести то, что она может работать с массивами исходных данных достаточно большой размерности.

 

Список использованной литературы

  1. Дубров А.М., Мхиторян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 1998.
  2. Бюль – SPSS
  3. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шебер М. Многомерный
  4. Статистический анализ в экономике: Учеб. Пособие для вузов/Под ред. проф.
  5. Тамашевича. – М.: ЮНИТИ-ДАНА, 1999. –598с.
  6. А. Епанешников, В. Епанешников. Программирование в среде Turbo Pascal
  7. 3-е изд., стер. –М.: “ДИАЛОГ-МИФИ”, 1997. –288с.
  8. Жуков Л.А., Стратан И.П. Установившиеся режимы сложных электрических сетей и систем: Методы расчетов. –М.: Энергия, 1979. – 416 с.

 


Информация о работе Метод главных компонент