Автор работы: Пользователь скрыл имя, 21 Января 2015 в 00:19, лекция
Управление знаниями (knowledge management) — новая дисциплина, занимающаяся вопросами создания и управления знаниями, представляющими интерес для компаний. Управление знаниями определяют также как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия. Управление знаниями включает определение ценных для компании знаний, их распространение среди сотрудников компании, использование и генерирование новых знаний.
Среди теоретических предпосылок возникновения knowledge management (КМ) можно выделить следующие.
Среди способов представления знаний различают словари с определениями понятий, тезаурусы, таксономии, онтологии, базы знаний.
Тезаурусом называют множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических отношений. Каждому понятию сопоставляется синонимичный дескриптор, и для дескрипторов явным образом указываются семантические отношения: род — вид, часть — целое, цель — средство и т. д.
Таксоном называют объект (понятие) некоторой предметной области. Таксономия (т.е. закон и упорядочение) — иерархическая структура классификаций определенного набора таксонов. В таксономиях отражены отношения "род-вид".
Онтология (в информатике) — формальное представление некоторой области знаний, включающее иерархическую структуру понятий, их связи и правила (теоремы, ограничения), принятые в этой области. Онтология вместе с набором индивидуальных экземпляров классов образует базу знаний. В действительности, трудно определить, где кончается онтология и где начинается база знаний. При этом онтологией можно называть базу однозначно понимаемых знаний.
Управление знаниями (knowledge management) — новая дисциплина, занимающаяся вопросами создания и управления знаниями, представляющими интерес для компаний. Управление знаниями определяют также как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия. Управление знаниями включает определение ценных для компании знаний, их распространение среди сотрудников компании, использование и генерирование новых знаний.
Среди теоретических предпосылок возникновения knowledge management (КМ) можно выделить следующие.
Известно, что приобретаемый опыт в производстве изделий позволяет сокращать издержки и затраты, что связано с расширением знаний (в сфере экономики ).
В сфере социологии знания генерируются, главным образом, в коллективах. На макроуровне — развиваются идеи постиндустриального, информационного или основанного на знании общества. На микроуровне исследуется поведение человека в группах и сообществах.
В философии и психологии КМ исследует различия между скрытыми и явными знаниями, между "знать как" и "знать что". Психология изучает то, как люди обучаются, забывают, действуют и т.п.
Различают корпоративные знания явные и неявные. Явные знания — это содержание документов организации таких, как письма, статьи, справочники, патенты, чертежи, программное обеспечение и т. п. Неявные (скрытые) знания — это персональные знания, связанные с индивидуальным опытом сотрудников. Часто именно скрытое знание является ключевым при принятии решении и управлении производственными процессами.
В управлении знаниями можно выделить следующие этапы:
1. Накопление, часто происходящее стихийно и бессистемно.
2. Извлечение.
3. Структурирование —
выделение основных понятий, выработка
способов представления
4. Формализация — перевод знаний в машинный формат.
5. Сопровождение (обслуживание) — удаление, корректировка, добавление, фильтрация данных и знаний для поиска информации, необходимой пользователям.
Data Mining (DM) — направление в области интеллектуальных систем, связанное с поиском в больших объемах данных скрытых закономерностей. Data Mining можно интерпретировать как обнаружение знаний в базах данных или как интеллектуальный анализ данных. Дословно DM переводится как добыча данных. Другими словами, это добыча знаний, необходимых для принятия решений в различных сферах человеческой деятельности. При этом под знаниями понимается совокупность сведений, которая образует целостное описание, соответствующее некоторому уровню осведомленности об описываемом вопросе, предмете, проблеме и т.д. Искомые закономерности часто выражаются в виде шаблонов (паттернов — patterns), которые представляют собой некоторые выборки данных. Построение моделей прогнозирования также является целью поиска закономерностей.
Cтатистические методы методы анализа данных и OLAP в основном ориентированы на проверку заранее сформулированных гипотез и на предварительный анализ данных, в то время как Data Mining занимается поиском неочевидных закономерностей.
Единого мнения относительно того, какие задачи следует относить к Data Mining, нет. В большинстве источников называются следующие основные задачи:
Важной задачей, близкой к Data mining является поиск знаний (knowledge discovery).
С помощью классификации объекты распределяются между заранее определенными группами.
Целью кластеризации является определение таких групп.
Ассоциация имеет целью определение отношений между событиями.
Прогнозирование используется для предсказания событий на основе известных уже имевших место фактов и событий.
Text Mining — одна из подобластей
Data Mining, которая ориентирована на
обработку текстовой
Основная особенность Data Mining — это сочетание количественного и качественного анализа. Большинство аналитических методов, используемых в технологии Data Mining, - это известные математические алгоритмы и методы.
Процесс извлечения знаний в Data Mining состоит из следующих стадий:
Стадия 1. Выявление закономерностей (свободный поиск).
Стадия 2. Использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование).
Стадия 3. Анализ исключений — выявление и объяснение аномалий, найденных в закономерностях.
Арсенал средств Data Mining довольно обширен. Классификация методов Data Mining выполняется по ряду признаков.
В зависимости от полноты используемых при анализе данных различают методы следующих двух групп:
1. Методы с непосредственным
использованием данных с их
сохранением на всех стадиях
анализа. Недостаток методов этой
группы — возможные сложности
анализа сверхбольших баз
2. Методы с выявлением
и использованием
Статистические методы Data mining подразделяют на следующие группы:
1. Дескриптивный анализ и описание исходных данных.
2. Анализ связей (корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ).
3. Многомерный статистический анализ (компонентный анализ, дискриминантный анализ, многомерный регрессионный анализ, канонические корреляции и др.).
4. Анализ временных рядов
(динамические модели и
К кибернетическим методам Data Mining относят:
• искусственные нейронные сети (распознавание, кластеризация, прогноз);
• эволюционное программирование (в т.ч. алгоритмы метода группового учета аргументов);
• генетические алгоритмы (оптимизация);
• ассоциативную память (поиск аналогов, прототипов);
• нечеткую логику;
• деревья решений;
• экспертные системы.
Кластеризация — разделение множества объектов на группы (классы, кластеры) по тем или иным признакам сходства объектов, т.е. формирование множества классов для объектов некоторой предметной области: . Нужно выбрать множество признаков (параметров) объектов, по которым определяется сходство объектов, и обучающую выборку.
Если множество метризовано, то оценкой близости двух объектов и будет норма вектора | – | (расстояние между и ). Например:
= max | - | при € [1: ] .
Межкластерное расстояние – расстояние между центрами кластеров. Центр -го кластера имеет усредненные координаты
= / ,
где – вектор параметров -го объекта, входящего в. -й кластер.
Один из алгоритмов кластеризации:
1) Все объекты обучающей выборки помещаются в первый кластер;
2) Объект с наибольшим
усредненным расстоянием от
3) Все объекты с меньшим
средним расстоянием до
4) Если наибольший диаметр
кластеров больше заданного
Диаметр =
Если множество неметризовано, то расстоянием между двумя объектами и будет число несовпадающих элементов в множествах и .
Знания - совокупность сведений, понятий, представлений о чем-либо, полученных, приобретенных, накопленных в результате учения, опыта, в процессе жизни и т.д. и обычно реализуемых в деятельности. Более формальные определения применяемые обычно в рамках менеджмента знаний:
еле ния сущностных зависимостей
.
Знание само задает контекст описания и является целостным описанием ситуации;
Представление знаний, их обработка и использование, рассматриваемое применительно к конкретной прикладной области, является предметом инженерии знаний. Коллекция совместно организованных знаний, относящихся к задачам, решаемым в системе искусственного интеллекта (ИИ), называется базой знаний (БЗ).
Итак, База знаний - это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом систем Искусственного интеллекта и Экспертных систем. Большинство БЗ ограничены в некоторой специальной, обычно узкой предметной области, в которой они сосредоточены. При создании БЗ технология ИИ позволяет встраивать в компьютер механизм и способности вывода, основывающиеся на фактах и отношениях, содержащихся в БЗ.
[1]
Предметная область - сфера человеческой деятельности, выделенная и описанная согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду.
Проблемная область - комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых в производственной системе, и стоящих перед ней целях.
При
исследовании экономических
[1]