Кластерный анализ

Автор работы: Пользователь скрыл имя, 17 Марта 2013 в 18:56, контрольная работа

Описание работы

При решении задачи сегментирования рынка, построении типологии стран по достаточно большому числу показателей, прогнозирования конъюнктуры рынка отдельных товаров, изучении и прогнозировании экономической депрессии и многих других проблем исследователь довольно часто сталкивается с многомерностью их описания.

Файлы: 1 файл

КР Кластерный анализ.doc

— 290.50 Кб (Скачать файл)

Для больших баз данных этот алгоритм эффективнее, чем алгоритм PAM. Эффективность алгоритма зависит  от выбранного в качестве образца  набора данных. Хорошая кластеризация  на выбранном наборе может не дать хорошую кластеризацию на всем множестве данных.

4. Алгоритмы Clarans, CURE, DBScan

Алгоритм Clarans (Clustering Large Applications based upon RANdomized Search) формулирует  задачу кластеризации как случайный  поиск в графе. В результате работы этого алгоритма совокупность узлов графа представляет собой разбиение множества данных на число кластеров, определенное пользователем. "Качество" полученных кластеров определяется при помощи критериальной функции. Алгоритм Clarans сортирует все возможные разбиения множества данных в поисках приемлемого решения. Поиск решения останавливается в том узле, где достигается минимум среди предопределенного числа локальных минимумов.

Среди новых масштабируемых алгоритмов также можно отметить алгоритм CURE  - алгоритм иерархической кластеризации, и алгоритм DBScan, где понятие кластера формулируется с использованием концепции плотности (density).

Основным недостатком  алгоритмов BIRCH, Clarans, CURE, DBScan является то обстоятельство, что они требуют  задания некоторых порогов плотности точек, а это не всегда приемлемо. Эти ограничения обусловлены тем, что описанные алгоритмы ориентированы на сверхбольшие базы данных и не могут пользоваться большими вычислительными ресурсами.

Над масштабируемыми  методами сейчас активно работают многие исследователи, основная задача которых - преодолеть недостатки алгоритмов, существующих на сегодняшний день.

 

2.5 Применение кластерного анализа

Спектр применений кластерного  анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии и других дисциплинах. «Тематика исследований варьирует от анализа морфологии мумифицированных грызунов в Новой Гвинее до изучения результатов голосования сенаторов США, от анализа поведенческих функций замороженных тараканов при их размораживании до исследования географического распределения некоторых видов лишая в Саскачеване».

В книге В.В.Налимова «Вероятностная модель языка»  описано применение кластерного анализа при исследовании восприятия живописи. Большая часть литературы по кластерному анализу появилась в течение последних трех десятилетий, хотя первые работы, в которых упоминались кластерные методы, появились достаточно давно. Польский антрополог К.Чекановский выдвинул идею "структурной классификации", содержавшую основную идею кластерного анализа - выделение компактных групп объектов.

По приблизительным  оценкам специалистов число публикаций по кластерному анализу и его  приложениям в различных областях знания удваивается каждые три года. Объективно существуют три основные причины этого явления. Это появление мощной вычислительной техники, без которой кластерный анализ реальных данных практически не реализуем. Вторая причина заключается в том, что современная наука все сильнее опирается в своих построениях на классификацию. Причем этот процесс все более углубляется, поскольку параллельно этому идет все большая специализация знания, которая невозможна без достаточно объективной классификации. Третья причина - углубление специальных знаний неизбежно приводит к увеличению количества переменных, учитываемых при анализе тех или иных объектов и явлений. Вследствие этого субъективная классификация, которая ранее опиралась на достаточно малое количество учитываемых признаков, часто оказывается уже ненадежной. А объективная классификация, с все возрастающим набором характеристик объекта, требует использования сложных алгоритмов кластеризации, которые могут быть реализованы только на базе современных компьютеров. Именно эти причины и породили «кластерный бум». 

Заключение

В заключении можно сказать, что кластерный анализ - это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы (кластеры)(Q-кластеризация, или Q-техника, собственно кластерный анализ). Кластер группа элементов, характеризуемых общим свойством, главная цель кластерного анализа  нахождение групп схожих объектов в выборке.

Кластерный анализ делает возможным разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней.

Большое достоинство  кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. При этом кластерный анализ не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы.  Он позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их  компактными и наглядными.

Анализ отечественных  и зарубежных публикаций показывает, что кластерный анализ находит применение в самых разнообразных научных направлениях: биология, медицина, археология, история, география, экономика, филология и т.д.

 

 

Список использованной литературы

  1. Дюран Б., Оделл П. Кластерный анализ / Пер. с англ. Е.З. Демиденко - М.: Статистика, 1977.- 128с.
  2. Жамбю М. Иерархический кластер-анализ и соответствия: Пер. с фр. - М.: Финансы и статистика, 1988. - 342с.
  3. Мандель И.Д. Кластерный анализ.- М.: Финансы и статистика. 1988. -176с.
  4. Никифорова Н.С. Кластерный анализ в задаче социально-экономического прогнозирования М.: МГИМО, 2001.
  5. Факторный, дискриминантный и кластерный анализ: Пер с англ./Дж. - О.Ким, Ч.У.Мьюллер, У.Р.Клекка и др.; Под ред. И.С.Енюкова. - М.: Финансы и статистика, 1989. - 215с.
  6. Электронный учебник по статистике. Москва, StatSoft. WEB: www.statsoft.ru/home/textbook/default.htm.

 

1 Дюран Б., Оделл П. Кластерный анализ / Пер. с англ. Е.З. Демиденко - М.: Статистика, 1977- с.15

2 Дюран Б., Оделл П. Кластерный анализ / Пер. с англ. Е.З. Демиденко - М.: Статистика, 1977- с.39-40

3 Дюран Б., Оделл П. Кластерный анализ / Пер. с англ. Е.З. Демиденко - М.: Статистика, 1977-- 35стр.


Информация о работе Кластерный анализ