Автор работы: Пользователь скрыл имя, 25 Февраля 2013 в 19:24, курсовая работа
В данной работе основной целью считаем необходимым рассмотреть вопросы кластерного анализа (основы кластерного анализа), а так же рассмотреть его терминологию и провести исследования кластерного анализа на конкретном примере.
ВВЕДЕНИЕ
2
1.
Определение и задача кластерного анализа
3
1.1
Определение кластерного анализа
1.2.
Задача кластерного анализа. Функции расстояния и меры сходства.
2.
Методы кластерного анализа
3
2.1.
Иерархические агломеративные методы
6
2.2.
Итеративные методы группировки. Метод k-средних
9
3.
Кластерный анализ в программе Statistica
12
ЗАКЛЮЧЕНИЕ
32
СПИСОК ИСТОЧНИКОВ И ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ
34
Приложение 1
Таким образом, использование иерархического метода кластерного анализа позволило выделить группы субъектов федеральных округов, сходных по структуре добавленной стоимости.
Заключение.
Сегодня кластерный анализ является одним из наиболее эффективных инструментов обработки больших объемов данных и используется повсеместно, где применяется вычислительная техника.
Методы кластерного анализа являются очень удобным средством для упрощения восприятия большого количества разрозненных данных путём выявления кластерной структуры. Разбиение выборки на группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа
Алгоритм кластеризации разбивает набор данных на группы, что позволяет вам сделать определенные выводы или заключения относительно объектов каждой группы. В отличие от регрессии или классификации, результатом кластерного анализа не является какое-либо одно результирующее значение, автоматически подразумевающее однозначный вывод. Вместо этого мы получаем возможность анализировать группы данных и делать самостоятельные заключения о тенденциях внутри каждой группы. В нашем примере кластерный анализ с применение м метода Уорда позволили разделить субъекты по имеющимся данным на ; класса (группы), тем не менее, конкретные заключения об особенностях каждого класса были сделаны нами без использования каких-либо готовых выводов. С этой точки зрения, использование кластерной модели связано с определенными трудностями (представьте, что было бы, если бы мы выбрали слишком большое число кластеров для нашей модели), но с другой стороны, мы смогли извлечь из результатов нашего кластерного анализа достаточно полезную и любопытную информацию, которую мы не смогли бы получить с помощью других рассмотренных методов.
Список литературы
Интернет ресурсы
www.machinelearning.ru - Информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных
www.intuit.ru/department/