Автор работы: Пользователь скрыл имя, 04 Ноября 2013 в 22:30, реферат
Наверное, у каждого, кто в первый раз выходил в мировую Сеть, дух захватывало от обилия возможностей и самой разнообразной информации. Все было безумно интересно и хотелось бродить по просторам Интернета часами. Потом эффект новизны проходит и мы начинаем относиться к нему как к средству зарабатывания денег, поиска информации или способу связи. И вот уже это средство не кажется нам таким чудесным. В данном реферате раскрываются основные технологии поиска информации в Интернет, предоставляются общие черты поисковых инструментов, рассматриваются структуры поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем.
Введение
Общая характеристика работы
1.Теория поиска информации
1.1 Как работают поисковые машины
1.2 Алгоритмы поиска. Законы Зипфа
1.3 Как поисковые машины могут использовать законы Зипфа
2.Представление базы данных
2.1 Матричное представление базы данных
2.2 Пространственно-векторная модель поисковой системы(ПС)
2.3 Полнота и точность поиска
3 Основные аспекты поиска информации
3.1 Этапы поисковой процедуры
3.2 Информационно-поисковый язык
4 Поисковые системы
4.1 Какая из поисковых машин лучше
4.2 Обзор основных поисковых систем
4.2.1 Google и его поисковые серверы
4.2.2 Яндекс и его поисковые серверы
4.2.3 Alta Vista и его поисковые серверы
4.2.4 Метапоисковые системы
4.2.5 Система поиска в конференциях Usenet News
4.2.6 Скрытый веб
5.Практическая часть
5.1 Сложные запросы в Яндекс
5.1.1 Анализ сложных запросов
5.1.2 Составление запросов
Заключение
Основные результаты работы
Рекомендации по практическому использованию результатов
Список использованных источников
Или слово «итальянский» играет второстепенное значение, так что смысл документов не соответствует запросу.
Переформулируем:можно воспользоваться оператором <<:
+французский << ($title(резюме) && +(москва | !495) && +linux && +windows)
Теперь слово «итальянский» будет иметь первостепенное значение для ранжирования, но при этом остальные слова тоже играют роль в результатах поиска.
Пример3
Найти описание алоэ,но чтоб не сталкиваться с прайс-листами Интернет-магазинов:
алоэ << (лечение|лечебный|болезни)
~~ (цена|прайс|рубль|доллар|
Будут найдены все страницы, где есть слово алоэ, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~.
Следующие задания взяты с Кубок.Яндекса 2000 года. Идея кубка состоит в том, что пользователи соревнуются в поиске в интернете ответов на заданные вопросы. Соревнование проводится между людьми, владеющими одним и тем же языком (группой языков). Участники могут пользоваться любыми поисковыми машинами или каталогами. Цель - максимально быстро выдать ответ на заданный вопрос.
Пример 4.
Как расшифровывается V.S.O.P на коньячной этикетке?
Запрос следует составить следующим образом: "V S O P коньяк сокращение", т.к. без последнего слова в большом количестве появятся ссылки на торговцев спиртными напитками. К тому же V.S.O.P. - это сокращение. Получено, однако, 2 ответа: Very Special Old Pale и Very Superior Old Pale.
Пример 5
Сколько стоил проезд в метро в феврале 95 года?
Для наиболее быстрого получения ответа был задан следующий запрос:
проезд метро стоимость 1995
Результат:600 рублей. Ответ находится в первой ссылке, выданной Яндексом
Пример 6
Сколько лет было жене Рубенса, когда Рубенс умер?
Сформулировав запрос: Рубенс жена биография можно получить много ссылок, дающих информацию не о художнике а о гонщике формулы 1 Барикелло Рубенсе.К тому же во многих текстах его называют еще и «Баррикелло».
Поэтому необходимо отсечь ненужные варианты, использовав запрос: Рубенс жена биография – Барикелло – Баррикелло.
Выйдя на страницу с биографией художника, определяем, что Рубенс женился на 16-летней Елене Фоурмен в 1630 году, а умер в 1640.
Пример 7
Hа каком этаже в Эрмитаже висят картины импрессионистов?
Запрос:Эрмитаж импрессионисты этаж
Результат: Получаем ссылки, в описаниях которых уже видно, что этаж третий.
Пример 8
Как называется денежная единица Hикарагуа?
Лучше будет искать страницу с общими сведениями о стране: "Hикарагуа валюта население площадь". Задав в яндексе, получим на первых страницах ответ: "кордоба" .
Пример 9
В какой группе в 1968 году играл Андрей Макаревич?
Поисковые системы индексируют числа. Следовательно, запрос можно сформулировать так: "Андрей Макаревич 1968 биография". На что получен результат The Kids
Пример 10
Как называлась и сколько весила атомная бомба, сброшенная на Хиросиму?
Учитывая, что требуется довольно конкретная информация, составим запрос так: +хиросима атомная бомба масса
ответ: "Малыш", 4080 кг.
Пример 11
Как назывались районы в японских городах, где жили гейши?
Запрос:Гейши район назывался
Результат: Ханамати - «цветочные улицы»
Пример 12
Когда в советской армии была введена практика выдачи военнослужащим по 100 грамм водки на человека в сутки?
Очевидно, что необходимо чтоб в запросе присутствовали слова 100 грамм и военнослужащие .Запрос:100 грамм водки военнослужащий
Результат:1 сентября 1945 года
Пример 13
Как называется душевное состояние, при котором человек боится всего?
Следует применить немного фантазии.Запрос формулируем так: +боязнь +всего психическая +болезнь
Ответ: Панафобия
Пример 14
Сколько литров воды вмещается в мешочек под клювом пеликана?
Запрос: мешочек клюв пеликана вмещается
Ответ:12 литров
Пример 15
В каком году Чарлз Лютвидж Додгсон (Доджсон) стал Льюисом Кэрролом?
Очевидно, что необходимо обязательно использовать в запросе имена собственные.
Запрос: Льюис Кэррол Чарльз Лютвидж Доджсон стал
Результат: Получены страницы, содержащие биографии писателя, перейдя по первой ссылке и нажав ctrl + F, узнаем ответ - в 1865 году
Пример 16
Когда Томас Эдисон впервые продемонстрировал электрическую лампочку?
Запрос : Эдисон впервые продемонстрировал электрическая лампочка
Результат:31 декабря 1879 года
Пример 17
К какому семейству приматов относится человек?
Если понять, где может содержаться ответ на этот вопрос, то все просто: "человек примат +семейство".Желательно перед «семейство» поставить плюс,т.к. употребление этого слова обязательно.
Получим ответ: Гоминиды.
Пример 18
Когда отмечается день независимости Зимбабве?
Задав вопрос "+Зимбабве день независимости", получим хорошие ссылки.
Ответ.18 апреля.
Пример 19
Кто был руководителем иностранных дел в России с 1648 по 1653 гг?
Запрос: иностранные дела России +1648 +1653
Волошенинов Михаил Дмитриевич - думный дьяк
Пример 20
Сколько куполов на соборе Василия Блаженного на Красной площади?
Запрос: собор Василия Блаженного !куполов
Ответов однако найдено 2: 11 и 10.
Пример 21
В каком году был издан первый перевод Библии на русский язык?
Запрос: первый перевод Библии на русский язык год
Ответ: В 1876 году
Пример 22
Назовите адрес кинотеатра "Октябрь" в городе Ярославле?
Очевидно, что слово адрес необязательно задавать в запросе,в то время как кинотеатр «октябрь» и Ярославль обязательно. Следовательно: кинотеатр «Октябрь» Ярославль.
Результат: в первой ссылке получаем улица Блюхера, 46а.
Пример 23
Каково среднее имя Джорджа Буша-младшего?
Заметим, что нецелесообразно задавать поисковику «среднее имя Джорджа Буша-младшего», лучше будет «Полное имя Джорджа Буша-младшего»
Результат: Уокер
Пример 24
В каком году в период с 1897 по 2003 года в г. Сыктывкаре была зарегистрирована самая высокая численность населения?
Запрос: Сыктывкар численность населения 1897 2003
Результат: ответ получен только в 7й ссылке.1989 год.
Пример 25
Чем выложены ступени к наиболее известному вулкану Ма Ань на втором по величине острове Китая?
Запрос: После усечения стоп-слов и слов, не имеющих особой смысловой нагрузки получаем «ступени вулкана Ма Ань»
Результат: магма.1я ссылка
Пример 26
В каком месяце года начинается действие фантастической повести В. Хлумова “Прелесть”?
Запрос: Хлумов +”Прелесть”
Результат: на 3й ссылке получаем текст повести, где в первом предложение находим Сентябрь.
Пример 27
Кто переводил Омара Хайяма на русский язык пятистопным анапестом?
Запрос: Омар Хайям пятистопный анапест
Результат: А.В. Старостин
Пример 28
Под каким псевдонимом опубликовал фантастический роман лауреат Нобелевской премии по физике?
Запрос: Формулируя запрос различными способами ответа в яндексе найдено не было,по крайней мере на первых 10 страницах,однако после того как такой же запрос был задан в Google ,ответ был выдан на первой же странице.
«лауреат Нобелевской премии по физике фантастический роман»
Результат: Улоф Иоханнессон
Пример 29
Каково имя третьей дочери первого президента Тувы?
Запрос: «семья первый президент республики Тыва»
Результат: Ооржак Анета Шериг-ооловна
Пример 30
Сколько невест было выдано замуж в Ивановской области в 2001 году?
Запрос: Следует применить немного логики. Ответ на этот вопрос скорее всего будет находиться в официальной статистике, а замужество на официальном языке это брак, следовательно «Брак Ивановская область 2001»
Результат: Получена ссылка, в которой говорится о количестве зарегистрированных браков на 2003 год и процент от 2001.Путем математических операций вычисляем 7066.
В данной работе были рассмотрены основные технологии поиска информации в Интернет и представлены в общих чертах поисковые инструменты, которые существуют на данный момент в Интернете, а также структура поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем.
Рекомендации по практическому использованию результатов
Применив полученные навыки по поиску информации в Интернет на практике, были получены результаты, на основе которых можно сделать следующие выводы:
А также, исходя из полученных знаний, можно дать общие рекомендации по эффективному поиску в Интернет:
Подводя итог вышесказанному, можно отметить, что единой оптимальной схемы поиска информации в Интернет не существует. В зависимости от специфики нужной пользователю информации, он может использовать соответствующие поисковые инструменты и службы. А от того, как грамотно будут подобраны поисковые службы, зависит качество результатов поиска.
Список использованных источников
Ресурсы Интернет:
http://www.searchengines.ru/
http://kubok.yandex.ru/
http://www.mycomp.com.ua/
http://www.seonews.ru /
Язык запросов. Как искать? Помощь Яндекса.
Google Всё о Google
Alta vista help, about altavista
Стратегия поиска
Итак, мы знаем, как система выделяет ключевые слова. Воспользуемся этим знанием, чтобы сформировать оптимальный запрос. Прежде всего, оговорим некоторые исходные предпосылки. Допустим, мы имеем некий текст-источник и хотим найти в сети Интернет документы схожего содержания. Откуда возьмется текст-источник? Поскольку сама задача поиска не могла возникнуть из ничего, где-то непременно должна существовать информация, возбудившая интерес к проблеме. Может быть, это журнальная статья, книга, веб-страница и т.п. Именно эту информацию и нужно упорядочить и привести в форму, удобную для анализа. Если задача существует только у вас в голове, попробуйте написать небольшое сочинение, изложив свое видение проблемы, -- оно и станет текстом-источником. Если бы нам удалось препарировать текст-источник так же, как это делает поисковая машина, по идее, мы могли бы получить результаты с максимально высокой релевантностью. Попробуем. Возьмем текст-источник и проанализируем его. Для автоматизации процесса можно заглянуть на интерактивную страничку www.shipbottle.ru/ir/.Когда текст-источник -- страница в журнале, анализ придется сделать вручную.