Автор работы: Пользователь скрыл имя, 17 Декабря 2014 в 17:38, реферат
На данный момент существует целый ряд методов машинного обучения на заранее размеченных данных, используемых специалистами в различных областях. Их применяют везде, где возможно применение логики. Они требуют достаточно большого количества таких данных для получения высоких результатов. При этом, на практике, объем неразмеченных данных значительно превышает объем размеченных данных. Например, объемы изображений рукописного текста значительно превышают объемы размеченных изображений символов
ВВЕДЕНИЕ
1. МАШИННОЕ ОБУЧЕНИЕ 4
2. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ОБУЧЕНИЯ ПО ПРЕЦЕДЕНТАМ 6
3. ТИПОЛОГИЯ ЗАДАЧ ОБУЧЕНИЯ ПО ПРЕЦЕДЕНТАМ 8
4. ПРИЛОЖЕНИЯ 13
5. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ 15
ЗАКЛЮЧЕНИЕ 26
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Точность классификации в методе «случайный
лес» зависит от численности построенных
деревьев решений, а также от их взаимной
корреляции. То есть в идеальном случае
для каждой рубрики мы должны построить
большое количество независимых деревьев
решений. Если эффективность каждого конкретного
дерева решений падает или возрастает
их зависимость, в этом случае снижается
и точность классификации этого метода.
В случае алгоритма «случайный лес», независимость
деревьев решений достигается через случайность
в выборе примеров из обучающей выборки
и через случайность в выборе для каждого
дерева узлов, по которым проводится анализ.
Метод «случайный лес» обладает множеством
положительных особенностей: параллельность
работы, высокая точность, быстрая обучаемость,
и тенденция к отсутствию переобучаемости.
Также, его положительной особенностью является то, что он показывает высокое качество рубрикации для обучающих выборок, с малым количеством примеров. Это свойство выделяет метод «случайный лес» среди множества других алгоритмов и является чрезвычайно ценным для успешного применения методов машинного обучения.