Метод главных компонент

Автор работы: Пользователь скрыл имя, 22 Сентября 2013 в 18:35, курсовая работа

Описание работы

Целью данной курсовой является рассмотрение метода главных компонент. В соответствии с поставленной целью необходимо выполнить следующие задачи:
1. Рассмотрение статистического подхода в методе главных компонент
2. Примеры использования главных компонент в экономике
3. Экономико-математическое моделирование факторов (на примере КР)

Содержание работы

Введение………………………………………………………………..……….3
Глава 1 Метод главных компонент. Определение. Задачи метода..............................................................................................................5
Глава 2 Статистический подход в методе главных компонент. Примеры использования главных компонент в экономике...........................9
Глава 3 Экономико-математическое моделирование факторов, определяющих уровень доступности жилья в Кыргызской Республике с помощью метода главных компонент…………………………………………11
ЗАКЛЮЧЕНИЕ…………………………………………………..…………….18
СПИСОК ЛИТЕРАТУРЫ………………………………...…………………..…20

Файлы: 1 файл

КУРСОВАЯ МЕТОД ГЛАВНЫХ.docx

— 101.18 Кб (Скачать файл)

Государственное образовательное  учреждение

Высшего профессионального  образования

Кыргызско-Российский Славянский университет 

 

Кафедра математические методы в экономике

 

 

КУРСОВАЯ  РАБОТА

ПО  МАТЕМАТИЧЕСКИМ МЕТОДАМ  В ЭКОНОМИКЕ

на тему: “Метод главных компонент”

 

 

Выполнил студент группы М-2-10:

                                                                      Кошоев Чингиз Маратович

Проверила:

Лукашева Ирина Викторовна

 

 

 

 

 

 

 

 

 

Бишкек 2013

Оглавление

Введение………………………………………………………………..……….3

Глава 1 Метод главных компонент. Определение. Задачи метода..............................................................................................................5

Глава 2 Статистический подход  в методе главных  компонент.           Примеры использования главных компонент в экономике...........................9

Глава 3 Экономико-математическое моделирование факторов, определяющих уровень доступности жилья в Кыргызской Республике с помощью метода главных компонент…………………………………………11

ЗАКЛЮЧЕНИЕ…………………………………………………..…………….18

СПИСОК ЛИТЕРАТУРЫ………………………………...…………………..…20

 

 

Введение

Во многих задачах обработки  многомерных наблюдений и, в частности, в задачах классификации исследователя  интересуют в первую очередь лишь те признаки, которые обнаруживают наибольшую изменчивость (наибольший разброс) при переходе от одного объекта  к другому.

С другой стороны, не обязательно  для описания состояния объекта  использовать какие-то из исходных, непосредственно  замеренных на нем признаков. Так, например, для определения специфики фигуры человека при покупке одежды достаточно назвать значения двух признаков (размер-рост), являющихся производными от измерений  ряда параметров фигуры. При этом, конечно, теряется какая-то доля информации (портной  измеряет до одиннадцати параметров на клиенте), как бы огрубляются (при  агрегировании) получающиеся при этом классы. Однако, как показали исследования, к вполне удовлетворительной классификации  людей с точки зрения специфики  их фигуры приводит система, использующая три признака, каждый из которых  является некоторой комбинацией  от большого числа непосредственно  замеряемых на объекте параметров.

Именно эти принципиальные установки заложены в сущность того линейного преобразования исходной системы признаков, которое приводит к главным компонентам.

 

Таким образом тема «Методы главных компонент» является актуальной. 

Целью данной курсовой является рассмотрение метода главных компонент. В соответствии с поставленной целью необходимо выполнить следующие задачи:

1. Рассмотрение статистического  подхода в методе главных компонент

2. Примеры использования главных компонент в экономике

3. Экономико-математическое моделирование факторов (на примере КР)

 

 

 

Глава 1 Метод главных  компонент. Определение. Задачи метода

Метод главных компонент (англ. Principal component analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном (англ. Karl Pearson) в 1901 г. Применяется во многих областях, таких как распознавание образов, компьютерное зрение, сжатие данных и т. п. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных. Иногда метод главных компонент называют преобразованием Кархунена-Лоэва (англ. Karhunen-Loeve) или преобразованием Хотеллинга (англ. Hotelling transform). Другие способы уменьшения размерности данных — это метод независимых компонент, многомерное шкалирование, а также многочисленные нелинейные обобщения: метод главных кривых и многообразий, метод упругих карт, поиск наилучшей проекции (англ. Projection Pursuit), нейросетевые методы «узкого горла», самоорганизующиеся карты Кохонена и др.

Как известно, социально-экономическое  явление можно характеризовать  целым рядом признаков. При большом  наборе таких признаков в корреляционно-регрессионном  анализе влияние связей становится затруднен, поэтому возникает необходимость сжатия, т.е. описание изучаемого явления (объекта) более укрупненным показателям, так называемыми "главными компонентами". Исходным степени здесь корреляционная матрица, на основании которой с использованием метода главных компонент может быть продлен анализ значений наблюдаемых признаков.

Правильно отобранные в корреляционную модель признаки, как правило, связаны  между собой. Наличие таких связей между ними позволяет на основе одного фактора иметь информацию о другом. Существование тесной связи между признаками дает основание для исключения одной из них. Например, если в модель урожайности включены две переменные x и х 2 , характеризующих денежные затраты на гектар, первая - все виды, вторая - затраты на удобрения. Здесь практически будет лишним при включении в модель признаки x исследовать также и признак х 2 , поскольку она тесно связана с первой. Идея учета одного признака на основании второго лежит в основе метода главных компонент.

Следует отметить, что речь не идет только о двух признаки. В  таком случае метод главных компонент  малоэффективен. Его используют, как  правило, при десятках взаеповьязаних признаков. При этом ставится цель "набрать" определенную часть общей вариации результативного признака минимальным количеством переменных. Последние подбирают до тех пор, пока сумма их дисперсий НЕ достигать заданной доли в дисперсии исследуемого явления (например, 60%, 80%, 90% и т.д.).

Метод главных  компонент решает следующие задачи:

1. Возмещение скрытых,  объективно существующих закономерностей  в изменении явлений.

2. Характеристика изучаемого, числом признаков, значительно меньше взятых, на начальном этапе. Число главных компонент, выделенных в процессе исследования, будет содержать (в компактной форме) больше информации, чем изначально измерены признаки.

3. Выявление признаков,  наиболее тесно связанных с  главной компонентой. Иначе говоря, изучение связи при которой с изменением одной переменной изменяется закон распределения второй, между ними.

4. Прогнозирования уровней  изучаемых явлений на основании  уравнения регрессии, которое  получено по информации главных  компонент.

Преимущества такого метода прогнозирования в отличие от классического регрессионного анализа  можно объяснить тем, что при  последнем в модель пытаются включить максимально возможное количество факторов, в экономических явлениях часто характеризуются существенной кореллируемости (мультилинеарнистю). Прогноз по такими переменными, как правило, бывает не точным. Поэтому возникает задача о замене исходных взаимосвязанных переменных совокупности некоррелированных параметров. Эта задача решается математическим аппаратом - методом главных компонент, который представляет собой характеристики, построенные на основе первично измеренных признаков.

Реализация практических возможностей указанных выше задач, которые решаются методом главных  компонент в области экономики, может быть представлена различным  направлениям.

Назовем их:

1. Анализ причинно - следственных  взаимосвязей показателей и установления  их стохастического связи с  главными компонентами.

2. Выделение обобщающих  экономических показателей.

3. Ранжирования результатов  наблюдений по главным компонентам

4. Классификация объектов  наблюдения.

5. Список исходной информации.

6. Построение уравнений  регрессии по обобщающим экономическим  показателям.

Как негативную сторону метода главных компонент следует назвать  сложность математического аппарата, обусловленного абсолютностью знаний теории вероятностей, математической статистики, линейной алгебры, а также  математического обеспечения ЭВМ. Формальное использование стандартных  программ без понимания математической сути вычислительных процедур может  привести к необоснованным выводам. Следует также помнить о профессиональные знания сути изучаемых экономических  явлений. Только при таких условиях метод главных компонент может  стать мощным математическим средством  познания существующих реалий в области  социально - экономических явлений.

 

Глава 2 Статистический подход  в методе главных  компонент. Примеры использования главных компонент в экономике

 

 

     Компонентный анализ относится к многомерным  методам снижения размерности. Он содержит один метод - метод главных компонент. В этом методе линейные комбинации случайных величин определяются характеристическими векторами ковариационной матрицы. Главные компоненты представляют собой ортогональную систему координат, в которой дисперсии компонент характеризуют их статистические свойства.     

В зависимости от конкретных задач, решаемых в экономике, используется один из методов факторного анализа, или метод главных компонент.     

Метод главных компонент считается  статистическим методом. Однако есть другой подход, приводящий к методу главных  компонент, но не являющийся статистическим. Этот подход связан с получением наилучшей проекции точек наблюдения в пространстве меньшей размерности. Для решения подобной задачи необходимо знать матрицу вторых моментов.

В статистическом подходе, задача будет заключаться в выделении  линейных комбинаций случайных величин, имеющих максимально возможную  дисперсию. Он опирается на ковариационную или корреляционную матрицу этих случайных величин. У этих двух разных подходов есть общий аспект: использование  матрицы вторых моментов как исходной для начала анализа.     

Из  сказанного следует, что для овладения методом главных компонент необходимо пользоваться методами теории вероятностей и математической статистики на основе моделей линейной алгебры. Рассмотрим основные положения этих математических дисциплин, на которые опирается метод главных компонент.     

Учитывая, что объекты исследования в экономике (фирма, завод, министерство, отрасль народного хозяйства, экономика страны) характеризуются большим, но конечным количеством признаков (характеристик), влияние которых подвергается воздействию большого количества случайных причин, в качестве моделей в статистическом плане возьмем многомерные распределения, а в алгебраическом - многомерное пространство признаков.     

Если  рассматривать с экономический  точки зрения то метод главных компонент применяется в оценке стоимости бизнеса, так же этом метод применяется при анализе экономической безопасности региона, для анализа признаков, оказывающих наибольшее влияние на результаты деятельности банков.      

Применение  метода осуществляется так же в анализе  рыночной конъюнктуры, модели рыночной конъюнктуры.

Говоря  о методе многомерного статистического анализа при помощи главных компонент, а также оценки эффективности экономических организаций, экономических систем и систем управления рассматривают задачи обработки многомерных наблюдений в экономике и проблемы совершенствования метода главных компонент и расширения области его применения. Изучаются основные принципы исследования операций, используемые в теории эффективности; дается оценка эффективности на основе критериев - игровых, информационных, теории массового обслуживания. 

 

Глава 3 Экономико-математическое моделирование факторов, определяющих уровень доступности жилья в  Кыргызской Республике с помощью  метода главных компонент

Рассмотрим, как доступность  жилья в Кыргызстане зависит  от социально-экономических факторов.

Для анализа будем использовать следующие данные, обозначенные в  SPSS следующим образом:

  • Инвестиции в основной  капитал, млн.сом. - inv_cap
  • Объем работ по договорам строительного подряда, млн. сом. - build_w
  • Ввод в действие жилья, тыс. кв.м. общей площади - homes_a
  • Денежные доходы населения, млн.сом. - inc_p
  • ИПЦ, % - CPI
  • Численность официально зарегистрированных безработных, тыс.чел. - workless
  • Среднемесячная зарплата, номинальная, сом - aver_sal
  • ВВП, млн. сом - GDP
  • Численность  населения, тыс. чел. - pop_kg
  • Обеспеченность жильем, кв.м/чел - square_a

Последняя переменная и будет  анализируемым фактором.

 

Введем в SPSS все необходимые данные:

 

Источником данных является сайт Национального Статистического  Комитета www.stat.kg

 

 

Перейдем во вкладку Analyze и выберем опцию Data reduction – Factor analysis.

Выберем для анализа метод главных компонент, указав Principal Components.

Информация о работе Метод главных компонент