Автор работы: Пользователь скрыл имя, 21 Января 2015 в 00:19, лекция
Управление знаниями (knowledge management) — новая дисциплина, занимающаяся вопросами создания и управления знаниями, представляющими интерес для компаний. Управление знаниями определяют также как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия. Управление знаниями включает определение ценных для компании знаний, их распространение среди сотрудников компании, использование и генерирование новых знаний.
Среди теоретических предпосылок возникновения knowledge management (КМ) можно выделить следующие.
6. http://lingvoworks.
В статье рассматриваются вопросы построения, структурирования, описания, классификации и использования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению формальных и лингвистических онтологий. Также, предложена достаточно подробная методология построения ресурсов онтологического типа.
7. http://aimatrix.nm.ru/
Статья, повященная семантическим сетям. Описывается история создания семантических сетей, а также принципы построения и классификация.
8. http://bibl.tikva.ru/
Статья о когнитивных картах. Приводится несколько примеров использования когнитивных карт.
9. http://ru.wikipedia.org/
Материал из википедии. Статья о семантических сетях.
10. http://lsdis.cs.uga.edu/
Сайт научно-исследовательского центра. Можно найти пример визуализации биохимической и биологической онтологии.
11. http://citeseerx.ist.psu.
В статье дается обзор исследований в области инженерии знаний, описываются принципы и методы, а также два подхода, сформированные в данной области. Ссылка на статью в формате pdf содержится на веб-странице.
12. http://www.vk-
Веб-сайт, посвященный инженерии знаний. На сайте можно увидеть новости, результаты научных исследований в виде статей, презентаций, видео.
13. http://www.commonkads.
Презентация. Введение в инженерию знаний. История и терминология.
14. http://web.cs.wpi.edu/~
Краткий обзор методов извлечения знаний.
15. http://cranedge.
Стратегия инженерии знаний. Автор статьи Jesu Valia
Корпоративная
база данных любого современного предприятия
обычно содержит набор таблиц, хранящих
записи о тех или иных фактах либо объектах
(например, о товарах, их продажах, клиентах,
счетах). Как правило, каждая запись в подобной
таблице описывает какой-то конкретный
объект или факт. Например, запись в таблице
продаж отражает тот факт, что такой-то
товар продан такому-то клиенту тогда-то
таким-то менеджером, и по большому счету
ничего, кроме этих сведений, не содержит.
Однако совокупность большого количества
таких записей, накопленных за несколько
лет, может стать источником дополнительной,
гораздо более ценной информации, которую
нельзя получить на основе одной конкретной
записи, а именно — сведений о закономерностях,
тенденциях или взаимозависимостях между
какими-либо данными. Примерами подобной
информации являются сведения о том, как
зависят продажи определенного товара
от дня недели, времени суток или времени
года, какие категории покупателей чаще
всего приобретают тот или иной товар,
какая часть покупателей одного конкретного
товара приобретает другой конкретный
товар, какая категория клиентов чаще
всего вовремя не отдает предоставленный
кредит.
Подобного
рода информация обычно используется
при прогнозировании, стратегическом
планировании, анализе рисков, и ценность
ее для предприятия очень высока. Видимо,
поэтому процесс ее поиска и получил название
Data Mining.
^
Data
Mining переводится как "добыча" или
"раскопка данных". Нередко
рядом с Data Mining встречаются слова
"обнаружение знаний в базах
данных" (knowledge discovery in databases) и "интеллектуальный
анализ данных". Их можно считать
синонимами Data Mining. Возникновение всех
указанных терминов связано с новым витком
в развитии средств и методов обработки
данных.
До
начала 90-х годов, казалось, не было особой
нужды переосмысливать ситуацию в этой
области. Все шло своим чередом в рамках
направления, называемого прикладной
статистикой . Теоретики проводили конференции
и семинары, писали внушительные статьи
и монографии, изобиловавшие аналитическими
выкладками.
Вместе
с тем, практики всегда знали, что попытки
применить теоретические экзерсисы для
решения реальных задач в большинстве
случаев оказываются бесплодными. Но на
озабоченность практиков до поры до времени
можно было не обращать особого внимания
— они решали главным образом свои частные
проблемы обработки небольших локальных
баз данных.
И
вот прозвенел звонок. В связи с совершенствованием
технологий записи и хранения данных на
людей обрушились колоссальные потоки
информационной руды в самых различных
областях. Деятельность любого предприятия
(коммерческого, производственного, медицинского,
научного и т.д.) теперь сопровождается
регистрацией и записью всех подробностей
его деятельности. Что делать с этой информацией?
Стало ясно, что без продуктивной переработки
потоки сырых данных образуют никому не
нужную свалку.
Специфика
современных требований к такой переработке
следующие:
Традиционная
математическая статистика, долгое время
претендовавшая на роль основного инструмента
анализа данных, откровенно спасовала
перед лицом возникших проблем. Главная
причина — концепция усреднения по выборке,
приводящая к операциям над фиктивными
величинами (типа средней температуры
пациентов по больнице, средней высоты
дома на улице, состоящей из дворцов и
лачуг и т.п.). Методы математической статистики
оказались полезными главным образом
для проверки заранее сформулированных
гипотез (verification-driven data mining) и для “грубого”
разведочного анализа, составляющего
основу оперативной аналитической обработки
данных (online analytical processing, OLAP).
В
основу современной технологии Data Mining
(discovery-driven data mining) положена концепция шаблонов
(паттернов), отражающих фрагменты многоаспектных
взаимоотношений в данных. Эти шаблоны
представляют собой закономерности, свойственные
подвыборкам данных, которые могут быть
компактно выражены в понятной человеку
форме. Поиск шаблонов производится методами,
не ограниченными рамками априорных предположений
о структуре выборке и виде распределений
значений анализируемых показателей.
Примеры заданий на такой поиск при использовании
Data Mining приведены в табл. 1.
^ Таблица 1. Примеры формулировок
задач при использовании методов OLAP и
Data Mining
|
|
|
|
|
|
|
|
Важное
положение Data Mining — нетривиальность разыскиваемых
шаблонов. Это означает, что найденные
шаблоны должны отражать неочевидные,
неожиданные (unexpected) регулярности в данных,
составляющие так называемые скрытые
знания (hidden knowledge). К обществу пришло понимание,
что сырые данные (raw data) содержат глубинный
пласт знаний, при грамотной раскопке
которого могут быть обнаружены настоящие
самородки (рис.1).
^ Рис. 1. Уровни знаний, извлекаемых из
данных
В
целом технологию Data Mining достаточно точно
определяет Григорий Пиатецкий-Шапиро
— один из основателей этого направления:
Data
Mining — это процесс обнаружения в сырых
данных ранее неизвестных, нетривиальных,
практически полезных и доступных интерпретации
знаний, необходимых для принятия решений
в различных сферах человеческой деятельности.
^
Сфера
применения Data Mining ничем не ограничена
— она везде, где имеются какие-либо данные.
Но в первую очередь методы Data Mining сегодня,
мягко говоря, заинтриговали коммерческие
предприятия, развертывающие проекты
на основе информационных хранилищ данных
(Data Warehousing). Опыт многих таких предприятий
показывает, что отдача от использования
Data Mining может достигать 1000%. Например, известны
сообщения об экономическом эффекте, в
10–70 раз превысившем первоначальные затраты
от 350 до 750 тыс. дол. [3]. Известны сведения
о проекте в 20 млн. дол., который окупился
всего за 4 месяца. Другой пример — годовая
экономия 700 тыс. дол. за счет внедрения
Data Mining в сети универсамов в Великобритании.
Data
Mining представляют большую ценность для
руководителей и аналитиков в их повседневной
деятельности. Деловые люди осознали,
что с помощью методов Data Mining они могут
получить ощутимые преимущества в конкурентной
борьбе. Кратко охарактеризуем некоторые
возможные бизнес-приложения Data Mining [2].
^
Розничная
торговля
Предприятия
розничной торговли сегодня собирают
подробную информацию о каждой отдельной
покупке, используя кредитные карточки
с маркой магазина и компьютеризованные
системы контроля. Вот типичные задачи,
которые можно решать с помощью Data Mining
в сфере розничной торговли:
Банковское
дело
Достижения
технологии Data Mining используются в банковском
деле для решения следующих распространенных
задач:
Телекоммуникации
В
области телекоммуникаций методы Data Mining
помогают компаниям более энергично продвигать
свои программы маркетинга и ценообразования,
чтобы удерживать существующих клиентов
и привлекать новых. Среди типичных мероприятий
отметим следующие:
Страхование
Страховые
компании в течение ряда лет накапливают
большие объемы данных. Здесь обширное
поле деятельности для методов Data Mining:
Другие
приложения в бизнесе
Data
Mining может применяться во множестве других
областей: