Управление знаниями

Автор работы: Пользователь скрыл имя, 21 Января 2015 в 00:19, лекция

Описание работы

Управление знаниями (knowledge management) — новая дисциплина, занимающаяся вопросами создания и управления знаниями, представляющими интерес для компаний. Управление знаниями определяют также как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия. Управление знаниями включает определение ценных для компании знаний, их распространение среди сотрудников компании, использование и генерирование новых знаний.
Среди теоретических предпосылок возникновения knowledge management (КМ) можно выделить следующие.

Файлы: 1 файл

Документ Microsoft Word.docx

— 291.41 Кб (Скачать файл)

Среди способов представления знаний различают словари с определениями понятий, тезаурусы, таксономии, онтологии, базы знаний.

Тезаурусом называют множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических отношений. Каждому понятию сопоставляется синонимичный дескриптор, и для дескрипторов явным образом указываются семантические отношения: род — вид, часть — целое, цель — средство и т. д.

Таксоном называют объект (понятие) некоторой предметной области. Таксономия (т.е. закон и упорядочение) — иерархическая структура классификаций определенного набора таксонов. В таксономиях отражены отношения "род-вид".

Онтология (в информатике) — формальное представление некоторой области знаний, включающее иерархическую структуру понятий, их связи и правила (теоремы, ограничения), принятые в этой области. Онтология вместе с набором индивидуальных экземпляров классов образует базу знаний. В действительности, трудно определить, где кончается онтология и где начинается база знаний. При этом онтологией можно называть базу однозначно понимаемых знаний.

 

Управление знаниями (knowledge management) — новая дисциплина, занимающаяся вопросами создания и управления знаниями, представляющими интерес для компаний. Управление знаниями определяют также как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия. Управление знаниями включает определение ценных для компании знаний, их распространение среди сотрудников компании, использование и генерирование новых знаний.

Среди теоретических предпосылок возникновения knowledge management (КМ) можно выделить следующие.

Известно, что приобретаемый опыт в производстве изделий позволяет сокращать издержки и затраты, что связано с расширением знаний (в сфере экономики ).

В сфере социологии знания генерируются, главным образом, в коллективах. На макроуровне — развиваются идеи постиндустриального, информационного или основанного на знании общества. На микроуровне исследуется поведение человека в группах и сообществах.

В философии и психологии КМ исследует различия между скрытыми и явными знаниями, между "знать как" и "знать что". Психология изучает то, как люди обучаются, забывают, действуют и т.п.

Различают корпоративные знания явные и неявные. Явные знания — это содержание документов организации таких, как письма, статьи, справочники, патенты, чертежи, программное обеспечение и т. п. Неявные (скрытые) знания — это персональные знания, связанные с индивидуальным опытом сотрудников. Часто именно скрытое знание является ключевым при принятии решении и управлении производственными процессами.

В управлении знаниями можно выделить следующие этапы:

1. Накопление, часто происходящее  стихийно и бессистемно.

2. Извлечение.

3. Структурирование —  выделение основных понятий, выработка  способов представления информации.

4. Формализация — перевод  знаний в машинный формат.

5. Сопровождение (обслуживание) — удаление, корректировка, добавление, фильтрация данных и знаний  для поиска информации, необходимой  пользователям.

 

Data Mining (DM) — направление в области интеллектуальных систем, связанное с поиском в больших объемах данных скрытых закономерностей. Data Mining можно интерпретировать как обнаружение знаний в базах данных или как интеллектуальный анализ данных. Дословно DM переводится как добыча данных. Другими словами, это добыча знаний, необходимых для принятия решений в различных сферах человеческой деятельности. При этом под знаниями понимается совокупность сведений, которая образует целостное описание, соответствующее некоторому уровню осведомленности об описываемом вопросе, предмете, проблеме и т.д. Искомые закономерности часто выражаются в виде шаблонов (паттернов — patterns), которые представляют собой некоторые выборки данных. Построение моделей прогнозирования также является целью поиска закономерностей.

Cтатистические методы  методы анализа данных и OLAP в основном ориентированы на проверку заранее сформулированных гипотез и на предварительный анализ данных, в то время как Data Mining занимается поиском неочевидных закономерностей.

Единого мнения относительно того, какие задачи следует относить к Data Mining, нет. В большинстве источников называются следующие основные задачи:

  • классификация,
  • кластеризация,
  • ассоциация,
  • последовательность,
  • прогнозирование,

Важной задачей, близкой к Data mining является поиск знаний (knowledge discovery).

С помощью классификации объекты распределяются между заранее определенными группами.

Целью кластеризации является определение таких групп.

Ассоциация имеет целью определение отношений между событиями.

Прогнозирование используется для предсказания событий на основе известных уже имевших место фактов и событий.

Text Mining — одна из подобластей Data Mining, которая ориентирована на  обработку текстовой информации  и широко применяется для мониторинга  ресурсов Интернет. Задача Text Mining —  проанализировать не синтаксис, а семантику значения текстов, выбрать из него информацию, наиболее  значимую для пользователя (есть  тесная связь с контент-анализом). Обычно выделяют такие приложения Text Mining:

  • реферирование текстов на естественном языке;
  • классификацию (тематическое индексирование) текстовых документов;
  • кластеризацию текстовых документов и их фрагментов;
  • построение онтологии текстового документа (основных терминов и связей между ними), например семантической сети;
  • визуализация полученных знаний.

Основная особенность Data Mining — это сочетание количественного и качественного анализа. Большинство аналитических методов, используемых в технологии Data Mining, - это известные математические алгоритмы и методы.

Процесс извлечения знаний в Data Mining состоит из следующих стадий:

Стадия 1. Выявление закономерностей (свободный поиск).

Стадия 2. Использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование).

Стадия 3. Анализ исключений — выявление и объяснение аномалий, найденных в закономерностях.

Арсенал средств Data Mining довольно обширен. Классификация методов Data Mining выполняется по ряду признаков.

В зависимости от полноты используемых при анализе данных различают методы следующих двух групп:

1. Методы с непосредственным  использованием данных с их  сохранением на всех стадиях  анализа. Недостаток методов этой  группы — возможные сложности  анализа сверхбольших баз данных. К этой группе относятся кластерный анализ, метод ближайшего соседа, метод k-ближайшего соседа, рассуждение по аналогии.

2. Методы с выявлением  и использованием формализованных  закономерностей, или дистилляция  шаблонов. При этом образцы (шаблоны) информации извлекаются из исходных  данных на стадии свободного  поиска и преобразуются в некие  формальные конструкции, которые  и используются на стадиях  прогностического моделирования  и анализа исключений. Очевидно, что шаблоны значительно компактнее  самих баз данных. К этой группе  относятся логические методы; методы  визуализации; методы кросс-табуляции; методы, основанные на уравнениях.

Статистические методы Data mining подразделяют на следующие группы:

1. Дескриптивный анализ  и описание исходных данных.

2. Анализ связей (корреляционный  и регрессионный анализ, факторный  анализ, дисперсионный анализ).

3. Многомерный статистический  анализ (компонентный анализ, дискриминантный  анализ, многомерный регрессионный  анализ, канонические корреляции  и др.).

4. Анализ временных рядов (динамические модели и прогнозирование).

К кибернетическим методам Data Mining относят:

• искусственные нейронные сети (распознавание, кластеризация, прогноз);

• эволюционное программирование (в т.ч. алгоритмы метода группового учета аргументов);

• генетические алгоритмы (оптимизация);

• ассоциативную память (поиск аналогов, прототипов);

• нечеткую логику;

• деревья решений;

• экспертные системы.

 

Кластеризация — разделение множества   объектов на группы (классы, кластеры) по тем или иным признакам сходства объектов, т.е. формирование множества   классов для объектов некоторой предметной области:      . Нужно выбрать множество   признаков (параметров) объектов, по которым определяется сходство объектов, и обучающую выборку.

Если множество   метризовано, то оценкой близости двух объектов   и   будет норма вектора |  –  | (расстояние между   и  ). Например:

 = max | - | при   € [1: ] .

Межкластерное расстояние – расстояние между центрами кластеров. Центр  -го кластера имеет усредненные координаты

 =  / ,

где   – вектор параметров  -го объекта, входящего в.  -й кластер.

Один из алгоритмов кластеризации:

1) Все объекты обучающей  выборки помещаются в первый  кластер;

2) Объект с наибольшим  усредненным расстоянием от других  объектов переносится во второй  кластер;

3) Все объекты с меньшим  средним расстоянием до объектов  второго кластера, чем до первого, переносятся во второй кластер;

4) Если наибольший диаметр  кластеров больше заданного порога, то для кластера с большим  диаметром повторяются пункты 1-3, иначе останов. Диаметр кластера  определяется как наибольшщее  расстояние между парой объектов, принадлежащих кластеру:

Диаметр =   

Если множество   неметризовано, то расстоянием между двумя объектами   и   будет число несовпадающих элементов в множествах   и  .

 
    1. Базы знаний.


Знания - совокупность сведений, понятий, представлений о чем-либо, полученных, приобретенных, накопленных в результате учения, опыта, в процессе жизни и т.д. и обычно реализуемых в деятельности. Более формальные определения применяемые обычно в рамках менеджмента знаний:

  • информация, подвергшаяся преобразованию в части выд 

еле ния сущностных зависимостей 

Знание само задает контекст описания и является целостным описанием ситуации;

  • результаты обобщения информации и установления определенных закономерностей в какой-либо предметной области, которые позволяют ставить и решать задачи в этой области;
  • ресурс, базирующийся на практическом опыте специалистов и на информации, существующей на предприятии.

Представление знаний, их обработка и использование, рассматриваемое применительно к конкретной  прикладной области, является предметом инженерии знаний. Коллекция совместно организованных знаний, относящихся к задачам, решаемым в системе искусственного интеллекта (ИИ), называется базой знаний (БЗ).

Итак,  База знаний - это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом систем Искусственного интеллекта и Экспертных систем.   Большинство БЗ ограничены в некоторой специальной, обычно узкой предметной области, в которой они сосредоточены.  При создании БЗ технология ИИ позволяет встраивать в компьютер механизм и способности вывода, основывающиеся на фактах и отношениях, содержащихся в БЗ.

[1]

    1. Задачи инженерии знаний.


      1. Анализ предметной и проблемной областей.


 

       Предметная область -  сфера человеческой деятельности, выделенная и описанная согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду.     

Проблемная область - комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых в производственной системе, и стоящих перед ней целях.      

 При  исследовании экономических систем  и решаемых ими задач с целью  формализации знаний в БЗ и  работе необходимо учитывать  специфику таких систем. Экономическим  системам присуща динамичность  функционирования, частая смена  ситуаций, обновление больших массивов  измерительных и других данных, характеризующих состояние объекта. Они часто функционируют в  условиях полной определенности  из-за действия случайных возмущающих  факторов.

[1]         

      1. Приобретение знаний. 

Информация о работе Управление знаниями