Интеллектуальная поисковая система Nigma

Автор работы: Пользователь скрыл имя, 06 Марта 2014 в 18:51, доклад

Описание работы

История проекта началась с исследований в области искусственного интеллекта, которые проходили на кафедре АСВК факультета вычислительной математики и кибернетики МГУ им М.В. Ломоносова в 2004-м году. Именно там познакомились и начали работу над Нигмой основатели проекта Виктор Лавренко и Владимир Чернышов
В 2005 году поисковики уже выдавали сотни тысяч ссылок на один запрос, просмотреть которые, просто, физически, было невозможно. Поэтому появилась потребность структурировать многочисленные результаты поиска. Для этого был создан кластеризующий поисковик, который позволяет уточнить запрос пользователя, группировать и фильтровать результаты поиска по темам. Так же была разработана и внедрена уникальная система исправления ошибок, которая позволяет исправлять до 4-х грубых ошибок в одном слове (включая опечатки)

Файлы: 1 файл

Nigma.docx

— 723.00 Кб (Скачать файл)

Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования

 

 

(НЗВАНИЕ УЧЕБНОГО  ЗАВЕДЕНИЯ)

 

 

 

(НАЗВАНИЕ КАФЕДРЫ)

 

Доклад на тему: 
«Интеллектуальная поисковая система Nigma»

 

 

 

Выполнил: 

Проверил(а):. 
 

 

 

 

Москва 
2014 
Оглавление

 

 

Интеллектуальная поисковая система Nigma

С чего начиналась Nigma

История проекта началась с исследований в области искусственного интеллекта, которые проходили на кафедре АСВК факультета вычислительной математики и кибернетики МГУ им М.В. Ломоносова в 2004-м году. Именно там познакомились и начали работу над Нигмой основатели проекта Виктор Лавренко и Владимир Чернышов 

В 2005 году поисковики уже выдавали сотни тысяч ссылок на один запрос, просмотреть которые, просто, физически, было невозможно. Поэтому появилась потребность структурировать многочисленные результаты поиска. Для этого был создан кластеризующий поисковик, который позволяет уточнить запрос пользователя, группировать и фильтровать результаты поиска по темам. Так же была разработана и внедрена уникальная система исправления ошибок, которая позволяет исправлять до 4-х грубых ошибок в одном слове (включая опечатки).

После успешного запуска Нигмы в РУнете, разработчики провели обширное маркетинговое исследование. По его результатам было решено создать принципиально новые поисковые алгоритмы, которые позволят выдавать необходимую информацию уже на странице результатов поиска, а не в виде ссылок на сайты, как это делают обычные поисковые системы. 

 

В 2007-м году Владимир Чернышов отправился в Стенфордский университ, где под руководством Гектора Гарсия Молины (научный руководитель создателей Google - C.Брина и Л. Пейджа) был разработан алгоритм, способный извлекать структурированную информацию из веб.страниц, обрабатывать ее и выдавать пользователю в виде удобной таблицы.

Ежедневно пользователи поисковой машины Nigma.ru делают более 1 миллиона переходов на сайты, ежемесячная аудитория сайта Nigma.ru составляет более 3 000 000 уникальных посетителей.

Нигма-фичи

Представляем твоему вниманию все Nigma-фичи, которые отличают ее от других.

  • Умные поисковые подсказки
  • Нигма-Математика
  • Нигма - Определения
  • Нигма-Химия
  • Нигма-Музыка
  • Поиск по торрентам
  • Инфопоиск
  • Официальные сайты
  • Табличный Нигма-поиск
  • Расшифровка сокращений
  • Поиск по библиотекам
  • Фильтр
  • Конвертер

Nigma-Математика - это сервис, с помощью которого пользователи могут решать различные математические задачи (упрощать выражения, решать уравнения, системы уравнений и т. д.), вводя их прямо в строку поиска в виде обычного текста. Также система распознает более тысячи физических, математических констант и единиц измерения, что позволяет пользователям производить операции с различными величинами (в том числе решать уравнения) и получать ответ в указанных единицах измерения. Помимо решения уравнений система решает все задачи, характерные для калькуляторов поисковых систем и конвертеров валют.

Nigma-Химия - это сервис, с помощью которого пользователи могут решать различные задачи по химии.

 

Nigma-Музыка - это сервис, упрощающий поиск музыкальных композиций. Поисковый робот Nigma.ru находит в Интернете музыкальные файлы и индексирует теги, содержащиеся в этих самых файлах, выдавая искомый результат по запросу.

1.Поиск музыкальных композиций

1.1.По исполнителю, альбому, песне

1.2.Группировка результатов по исполнителю, альбому и жанру

1.3.Перейти к тексту песни

2.Скачать музыкальный файл

3.Прослушать песню в режиме онлайн 

4.Загрузить свою музыку на Nigma

Умные поисковые подсказки

Нигма отвечает на вопрос еще до того, как пользователь введет его в строку поиска. Если пользователь начинает вводить запрос в Нигму, то она не просто предлагает варианты запросов, но мгновенно выдает ответ на вопрос справа от каждого варианта

1.1. Короткий запрос

Если ввести короткий запрос в строку поиска, то система сама подберет похожие варианты. 

1.2. Энциклопедическая  справка

Также если подвести указатель мыши к интересующему результату выдачи из автозаполнения, то выйдет подсказка с энциклопедической информацией. 

1.3. Точный запрос

Если ввести более точный (подробный) запрос, то система выдаст подробную информацию об объекте поиска. 

Также можно получить информацию о руководителе, например, компании Apple, введя в строку поиска «Стив Джобс»: 

2. Цена и характеристика  товаров

Набирая в поисковой строке Nigma названия товаров, пользователи видят их минимальную стоимость, даже не нажимая кнопку «Найти». 

2.1. Название товара

Если начать набирать в строке поиска название товара, то сразу выйдет автозаполнение с ценами. 

2.2. Категория товаров

Для наиболее востребованных категорий товаров поисковая система составляет списки, в первую очередь, предлагая самые дешевые и популярные.

3. Быстрый переход  на сайт

Попасть на самый популярный по запросу ресурс, пользователи могут еще до перехода к выдаче результатов. Для этого нужно  выбрать интересующую строку кнопками "вверх"/"вниз" и нажать "вправо", после чего моментально будет открыт запрашиваемый ресурс.

Поиск торрентов

Поиск торрентов от Нигма.РФ ведется только по бесплатным торрент-трекерам, не требует регистрации и не докучает назойливой рекламой.

Как это работает:

Способ 1:

Можно осуществлять поиск по торрентам, приписывая к запросу слово "торрент" ("торент", "torrent", "torent"), будет выдана таблица с торрент-файлами, в которой можно фильтровать торренты по формату видео:

Способ 2:

Пользователь может ввести общий запрос, например "скачать фильм" , в этом случае система, помимо результатов поиска, выдаст строку поиска по торрентам:

Если ввести в строку поиска по торрентам конкретный запрос и нажать "Найти торренты!", то будет выдан результат в виде таблицы торрентов с возможностью скачивания:

При нажатии на заголовок результата,  пользователь увидит окно загрузки торрент-файла, который можно скачать без дополнительной регистрации: 

Из таблицы можно попасть на страницу торрент-трекера с подробной информацией о торренте:

Чтобы вернуться к обычным результатам поиска, нужно нажать на ссылку "показать все результаты".

Табличный Нигма-поиск

Поисковая система Нигма.РФ первая из всех поисковых систем научилась автоматически выдавать списки объектов на запросы пользователей в виде таблиц. С помощью такого способа представления результатов поиска, пользователь может получить структурированную информацию по запрос в виде легко читаемой и понятной таблицы.

 

Как это работает:

1. Таблицы

Пользователь может найти структурированную информацию, например, по такому запросу, как "Радиостанции России ":

в результатах поиска Нигма покажет наглядные таблицы с исчерпывающей информацией по запросу:

*Для того, чтобы узнать больше о найденных объектах, пользователь может перейти по ссылке и Nigma выдаст подробную информацию в виде удобной таблицы, которую можно скачать себе на компьютер (**).

Инфопоиск

Инфопоиск -  алгоритм индексации Интернет-сайтов, который расщепляет содержимое web-страниц на информационные блоки. Затем блоки, содержащие информацию, связанную с запросом пользователя, подмешиваются в результаты поиска с более высоким приоритетом. На данный момент этот алгоритм индексации, извлекающий структурированную информацию из веб-сайтов и группирующий полученную информацию (с учетом более 30 критериев) и способный выдавать её в виде таблицы.

Как это работает:

1.1. Инфопоиск

Пользователь вводит интересующий его запрос:

Nigma выведет самую важную  информацию непосредственно в  результатах поиска , оформленную  в виде таблицы, которую можно  посмотреть как кратко так  и целиком, нажав на "Еще":

Вывод данных в такой форме часто позволяет сэкономить время и быстрее получить необходимую информацию:результат максимально информативен:

1.2. Инфопоиск книги

Так же, работу Инфопоиска можно применять для поиска по бесплатным электронным библиотекам. Например, при поиске конкретного автора:

одним нажатием мышки пользователь получит все доступные в интернете книги автора:

Также система может автоматически подбирать литературу по конкретным жанрам, названиям, типам файлов и т.д :

1.3. Инфопоиск работы

Инфопоиск так же может помочь при поиске вакантных мест для работы: предоставив пользователю всю необходимую информацию непосредственно в результате поиска :

Для отображения полной информации в таблице необходимо нажать "Еще". Нажатие "Больше вакансий" выведет таблицу с большим числом вакансий по введенной должности:

Пользователь может воспользоваться функцией кластеризации с целью корректировки параметров запроса:

Официальные сайты

Нигма.РФ повысила приоритет первоисточников информации в поисковой выдаче. Теперь, если запрос пользователя связан с компанией или известной личностью, у которой есть официальный сайт, такой сайт будет выделен в особый блок и выдан на первом месте в поисковой выдаче.

Как это работает:

Пользователь вводит в строку поиска интересующий его запрос:

Первой строчкой, будет выведен результат с изображением   , это значит что данная ссылка является официальным источником информации. Так же, помимо основного результата, будут выданы дополнительные официальные информационные каналы, объединенные в один блок:

При нажатии на ссылку "Показать все официальные сайты по запросу...", пользователи получат все официальные сайты других менее популярных одноименных объектов.

 

Расшифровка сокращений

Расшифровка сокращений - система распознает практически любые русско- и англоязычные аббревиатуры. Пользователь вводит искомую аббревиатуру, и помимо результатов поиска, с левой стороны, Nigma предложит один или несколько вариантов ее значения.

Как это работает:

1. Русскоязычные сокращения

1.1. раздел "Аббревиатуры"

2. Англоязычные сокращения

Принцип работы системы по расшифровке сокращений одинаков, как для русско- , так и для англоязычных аббревиатур, например:  

1. Русскоязычные  сокращения

Вводим запрос-сокращение, например, «беруши», нажимаем кнопку «Найти»: 

Внимание! Нижняя черная раскрывающаяся надпись "Аббревиатуры" в столбце кластеров слева от результатов поиска и есть расшифровка аббревиатуры. 

1.1. Раздел "Аббревиатуры"

Кроме того, в колонке слева есть отдельный раздел "Аббревиатуры", раскрыв который, можно увидеть, как еще может расшифровываться Ваш запрос-аббревиатура, например, "мч":

 

2. Англоязычные сокращения

Например, запрос «imho»:

Поиск по библиотекам

Поиск по электронным библиотекам помогает находить полную информацию по любому автору и тексты всех его произведений, как русской, так и зарубежной литературы. Система осуществляет поиск по более чем 100 электронным библиотекам.

1. Поиск по русской литературе 

1.1. По фамилии автора

Написав только фамилию автора, Вы сможете найти его произведения, например:  

1.2. Текст произведения автора

Чтобы найти конкретный текст автора, необходимо дополнить запрос названием произведения, например: Лесков Левша:  

2. Поиск по зарубежной литературе

В строке поиска можно написать как имя автора (вариант А), так и название его произведения (вариант Б):

Вариант А:

Вариант Б:

Фильтры

На основе запроса пользователя Nigma формирует список документов, разделяя его на группы (фильтры). С помощью фильтров  пользователь может уточнить запрос и быстро отсортировать найденные документы по нужной ему теме (выбрать нужные или исключить лишние темы).

1. Фильтры

Введя общий запрос "кинотеатры":Поисковая система Nigma.ru выдает более пятидесяти миллионов документов:Nigma.ru группирует найденные результаты по темам, близким по смыслу к запросу пользователя, и выводит их в колонке слева. 

Например, по запросу "кинотеатры" в левой колонке пользователи видят самые популярные темы новостей, которые встречаются в интернете.

Например, нажав на тему "кинотеатры москвы", пользователи получат результаты, связанные только с кинотеатрами города Москва. Таким образом, пользователь может быстро отсортировать найденные документы по нужной ему теме:

2. Управление фильтрами

2.1 Использование фильтров

Пользователь может изменять параметры поиска по фильтрам: выделять и исключать фильтры. Для того, чтобы отметки фильтров повлияли на результат, необходимо нажать "Применить фильтр":

После фильтрации Nigma выведет новый результат:

 

2.2 Выделение фильтра

Фильтры можно применять ко всей выдаче:

3. Ответы на вопрос

Также система старается отвечать на вопросы пользователей уже на странице результатов поиска и выделяет фильтр, являющийся ответом:

Конвертер валют

Конвертер валют позволяет переводить денежные единицы из одной валюты в другую, а также производить вычисления одновременно с разными валютами.

Внимание:

-Расчет производится  на основании курсов опубликованных  ЦБ РФ;

-Курсы валют обновляются  ежедневно в 11.00 по московскому  времени;

-В качестве валюты  для рассчетов используется российский  рубль.

1. Вычисление операций с валютами

Система позволяет производить вычисления с различными валютами, при этом в качестве валюты для вычисления используется российский рубль.

Информация о работе Интеллектуальная поисковая система Nigma