Поисковые системы в сети интернет

Автор работы: Пользователь скрыл имя, 12 Июня 2013 в 12:48, курсовая работа

Описание работы

За время существования Интернета предпринимались различные попытки организации поисковых средств. Многие из этих попыток оказались неудачными, другие же привели к созданию удобных средств поиска информации, которые до сих пор остаются популярными. Наиболее удачные проекты появились в последние пять лет. В данной курсовой работе рассматривается поиск информации во Всемирной паутине с помощью нескольких наиболее распространённых систем поиска (Рамблер, Яндекс и т.д.). Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от ваших личных пристрастий. Отметим, что поисковые системы часто называют поисковыми машинами или машинами поиска.

Содержание работы

1.Введение 2
2.Теоретическая часть. 3
2.1 Особенности поисковых систем 3
2.2 Методы поискового запроса 4
2.3 Поисковая система Yandex 7
3.Практическая часть. 11
3.1 Опыт №1. Поиск с помощью Alta Vista 11
3.2 Опыт №2. Использование системы Yahoo 20
3.3 Опыт №3. Поиск в системе Infoseek 23
3.4 Опыт №4. Система поиска Hot Bot 24
3.5 Опыт №5. Поиск новостей 26
3.6 Опыт №6. Поиск файлов в Интернете 28
3.7 Опыт №7. Поиск с помощью системы Рамблер 30
3.8 Опыт №8. Поиск с помощью системы Апорт 32
3.9 Опыт №9. Поисковая система Яндекс 34
3.10 Опыт №10. Системы каталогов 35
4.Какая из поисковых систем лучше? 37
5.Заключение 38
6.Список литературы 39

Файлы: 1 файл

Курсовая.doc

— 967.00 Кб (Скачать файл)

Министерство  образования и науки Российской Федерации

Федеральное государственное  бюджетное образовательное учреждение

высшего профессионального  образования

«Тульский государственный  педагогический университет им. Л.Н.Толстого»

(ФГБОУ ВПО «ТГПУ им. Л.Н.Толстого»)

                                                                           Кафедра Информатики и МОИ

                                                    

                                                     КУРСОВАЯ РАБОТА

на тему:

«Поисковые системы в сети интернет»

                                                                     Выполнила:

студентка 3 курса  группы 150191

факультета МФиИ

специальности «Математика» с дополнительной специальностью «Информатика»

                                                                    

                                                                  

 

 

 

 

                                             Тула 2011

 

Оглавление

 

 

 

 

1.Введение

 

Современный этап развития цивилизации характеризуется  переходом наиболее развитой части  человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети Интернет.

Пополнение  информационных ресурсов Интернета  происходит высокими темпами, и найти  необходимую информацию становиться  всё труднее. Различные печатные справочники устаревают ещё до выхода в свет. Единственным надёжным способом поиска информации является использование различных поисковых систем, которые постоянно отслеживают изменение  и обновление информации в сети.

За время  существования Интернета предпринимались  различные попытки организации поисковых средств. Многие из этих попыток оказались неудачными, другие же привели к созданию удобных средств поиска информации, которые до сих пор остаются популярными.

Наиболее удачные  проекты появились в последние  пять лет. В данной курсовой работе рассматривается поиск информации во Всемирной паутине с помощью нескольких наиболее распространённых систем поиска (Рамблер, Яндекс и т.д.). Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от ваших личных пристрастий. Отметим, что поисковые системы часто называют поисковыми машинами или машинами поиска.

2.Теоретическая часть.

2.1 Особенности поисковых систем

Поисковой процесс  представляет собой четыре этапа: формулировка(до начала поиска), действие (идет поиск), обзор результатов (выводится на экран), и усовершенствование(возвращаемся к поиску с той же потребностью, но уже иной формулировкой). Более удобная схема поиска состоит из следующих этапов:

  • Задание информационной потребности на естественном языке;
  • Выбор поисковых сервисов и точная запись информационной потребности;
  • Выполнение созданных запросов;
  • Предварительная обработка полученных ссылок на документы;
  • Обращение за искомыми документами;
  • Предварительный просмотр найденных документов;
  • Сохранение подходящих документов для изучения;
  • Извлечение из подходящих документов ссылок для расширения запроса;
  • Изучение всех сохраненных документов;
  • Если искомая информация не найдена, то возвращаемся к первому пункту.

2.2 Методы поискового запроса

Процесс поиска довольно прост: задавая ключевые слова, характерные для искомой информации, мы найдём нужный нам документ. Вне  зависимости от того, какой поисковой  системой вы пользуетесь, примерный  алгоритм поиска информации следующий:

  • Вы переходите на начальную страницу поисковой системы или на любую страницу, на которой находятся поля для ввода запроса и кнопка для начала поиска. В последнем случае после нажатия кнопки вы автоматически перейдёте на страницу поисковой системы.Отличий между собственно поисковой системой и страницей с полями для ввода запроса, который передаётся поисковой системе,нет.Главное – перейти на страницу, на которой вы можете ввести ваш запрос;
  • Если система позволяет последовательные уточнения области поиска, то вы переходите в разделы, определяющие границы поиска информации (например, поиск только в области науки или поиск среди европейских узлов Интернета).В таких системах,запрос в главном разделе,осуществляет поиск среди всех узлов Интернета. Если же вы, например,перейдёте в раздел «Новости», то поиск по запросу будет выполняться только среди узлов, посвящённых новостям. Таким образом, вы сначала определяете границы поиска,после этого отправляется запрос на поиск информации. Если выбранная вами система поиска не позволяет уточнить запрос, то это действие пропускается;
  • Вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. В простейшем случае это одно или несколько слов, например «Анекдоты», но возможны и сложные запросы с логическими операциями «И», «ИЛИ», «НЕТ»;
  • Если система поиска позволяет, то уточняются некоторые параметры запроса с помощью дополнительных полей, списков, флажков и переключателей, которые могут находиться на странице рядом с полем запроса. В большинстве случаев уточнение параметров не требуется. Составление сложных запросов чем-то похоже на программирование и пользуется популярностью у программистов,людей, не знакомых с программированием;
  • Нажимается кнопка для начала поиска.После некоторой паузы вы автоматически попадаете настраницу со списком документов,удовлетворяющих вашему запросу. Длительность паузы зависит от сложности запроса, скорости работы поисковой системы и качества вашей связи с данной системой;
  • Если ссылок много и они не помещаются на одной странице, то после прочтения первой страницы с результатами поиска вы можете перейти к следующей, и так далее. Таким образом, вы просматриваете все найденные ссылки на документы;
  • После нахождения нужной ссылки вы щёлкаете на ней мышью и переходите на страницу, которую вы разыскивали. Если вы захотите посмотреть другие найденные страницы, то можно вернуться назад, к странице со ссылками на найденные документы, и перейти по другой ссылке.

Когда говорят  о поисковых запросах, то часто  упоминают слово «релевантность». Слово релевантность означает степень соответствия документа запросу. Чем больше релевантность, тем лучше результаты поиска . Релевантность определяется по следующим критериям:

  1. Проверяется, сколько раз заданное словосочетание (слово) встречается на отображенных страницах;
  2. Если введена фраза, то проверяется расстояние между словами;
  3. Индекс цитируемости (количество ссылок на данную страницу);
  4. Чем больше на страницу ссылаются, тем больше вероятность, что именно эта страница нужна пользователю;
  5. Каким стилем (шрифтом) написана на странице искомая фраза;
  6. (Если фраза выделена жирным или написана крупным шрифтом; (заголовок), то это признак более высокой релевантности страницы);
  7. Возраст сайта(Чем старше сайт, тем лучше это влияет на релевантность).

Таким образом, можно отметить, что уровень релевантности – это целый комплекс параметров.

 

Итак, для того чтобы найти интересующую вас  информацию в кротчайшие время, вам  необходимо правильно составлять поисковой  запрос.

 

Наиболее эффективным  является следующий метод составления поискового запроса:

  1. Слова поискового запроса нужно писать грамотно. Так например, запрос «пошив пальтов» нужного результата не даст;
  2. Если поиск нужных результатов не принес, нужно переформулировать запрос с помощью синонимов;
  3. Если результат поиска не удовлетворяет вас, то попробуйте включить в запрос уточняющие слова. Для запроса «стихи Пушкина» слово «стихи» является уточняющим;
  4. В сложных случаях нужно использовать язык запросов. С помощью языка запросов можно задавать комбинации разных критериев поиска.

2.3 Поисковая система Yandex

Подробнее рассмотрим язык запросов поисковой системы Yandex. Предположим, что нам нужно найти  адрес проживания Мартиросяна С.Т. Если правильно сформулировать поисковой  запрос, то это не составит нам труда. В языке запросов есть такая функция, как включение/ исключение определенных слов – знаки «+» и «-».

Попробуем сформулировать поисковой запрос. Для этого используем фамилию человека и пару уточняющих слов. В качестве уточняющего слова  возьмем «адрес» и дату рождения человека. Получим:

Рис.1

Как видно на рисунке 1 нашлось 7 страниц, но с помощью языка запросов можно сократить их число до 1 страницы. Применим специальный символ «+» к уточняющим словам – это означает, что будут найдены те страницы, на которых в обязательном порядке присутствуют уточняющие слова. Получим:

Рис.2

На рисунке 2 видно, что мы нашли 1 страницу, без лишнего мусора. Этот поисковый запрос сформулирован правильно.

Еще одним важным символом языка запросов является знак «|». Вертикальная черта позволяет задать альтернативы – система ищет хотя бы одно из перечисленных слов. Например запрос: «Физика лекции|конспекты» будет аналогичен как запросам «Физика лекции» и «Физика конспекты».

Обычно поисковики ищут все формы введенного слова. Например по     запросу «Звукоизолирующая» будут выведены страницы со словом «звукоизолирующий» , «Звукоизолирующих» и т.д.

Рис. 3

Но чтобы  найти именно ту форму слова, которая  задана в поисковой строке, в языке  запросов предусмотрен символ «!». Применение этого символа видно на рисунке 4.

 

Рис. 4

Если вам  нужно найти точную фразу, то следует  её заключать в кавычки: «»

В случае, когда  вы хотите найти все варианты фразы: «очень (любое слово) девушка». То нужно поставить запрос так «очень /+2 девушка» , причем 1 – это означает отсутствие слова, а 3 означает, что между «очень» и «девушка» будут два любых слова:

Рис.5

На рисунке 5 видно как между словами «очень» и «девушка» вставлено «любое слово».

 

 

 

 

 

Следует отметить, что при выполнении запроса поисковая  система не ищет документ непосредственно в Интернете. Она обращается к своей базе данных, где в компактном виде собраны данные об информации в Интернете. Возможно, что реальное состояние Интернета несколько отличается оттого, что храниться в базе данных.

Поисковые системы постоянно пополняют и обновляют свои базы данных, чтобы минимизировать такое несовпадение. Существует способ пополнения информации в базы данных поисковых машин:Разработчик Web-страницы самостоятельно добавляет ссылку на неё в поисковую систему. Большинство систем позволяют это сделать совершенно бесплатно. Специальная программа, называемая роботом, находит ссылку на новую страницу во Всемирной паутине. Роботы запускаются поисковой системой, что бы проверить, существуют ли ранее найденные документы и не появились ли новые

3.Практическая часть.

3.1 Опыт №1. Поиск с помощью Alta Vista

В этом опыте  мы познакомимся с системой Alta Vista. Поисковая система Alta Vista была открыта для свободного использования в конце 1995 года. Это система до сих пор является достаточно популярной, хотя в последнее время другие системы составляют ей значительную конкуренцию. Система обеспечивает поиск как во Всемирной паутине, так и в группах новостей. После ввода ключевых слов вы получаете информацию о количестве найденных документов и их краткие описания со ссылками на информацию в Интернете. Расширенный поиск позволяет использовать логические операторы для формирования сложных запросов. Рассмотрим возможности системы Alta Vista на конкретных примерах.

Перед началом работы с  поисковыми системами следует установить связь с поставщиком услуг  Интернета, после чего перейти на начальную страницу работы с поисковыми системами:

  1. Запустить программу Internet Explorer или Netscape Navigator в зависимости от ваших личных предпочтений;
  2. Установить связь с поставщиком услуг Интернет;.
  3. Введите в поле адреса www.AltaVista.com, что бы перейти на нужную страницу. Будет загружена начальная страница поисковой системы (Рис. 1.1).

Рис.1.1 Начальная страница системы Alta Vista

На начальной  странице кроме поля для ввода  запроса расположен открывающийся  список. С его помощью можно  выбрать интересующий вас язык искомого документа: any languache (Любой язык), Russian (Русский) или любой другой язык. По умолчанию ищется информация на любом языке. Выше поля ввода расположены несколько ярлычков, щелчком на которых можно выбрать область поиска:Web (Паутина) – во Всемирной паутине, News (Новости) – в группах новостей и так далее.

Зададим несколько простых  вопросов для поиска информации, что бы продолжить знакомство с возможностями системы Alta Vista. Для поиска документов содержащих некоторое слово, надо ввести это слово, а для поиска документов, содержащих искомое словосочетание, необходимо заключить несколько слов в двойные кавычки. Если слово содержит только строчные буквы, то ему сопоставляются также и слова, содержащие заглавные буквы.

Например, слову интернет будет поставлено в соответствие интернет, Интернет и ИНТЕРНЕТ. То есть, что бы найти слово, написанное, как большими, так и маленькими буквами, надо в запросе использовать только маленькие буквы (строчные).

Наличие заглавных  букв в слове, заданном в запросе, конкретизирует поиск. В результате поиска будет найдено точно такое  слово с учётом регистра. Например, на запрос интерНЕТ будет найдено только слово интерНЕТ, если оно, конечно, имеется в базе данных. Слова же интернет, Интернет и ИНТЕРНЕТ по такому запросу найдены не будут. Давайте проверим эти правила на примерах.

  1. Введите в поле ввода запроса слово интерент;
  2. Нажмите кнопку Find (Поиск), расположенную правее поля ввода. В нашем случае было найдено 1763 вхождений;
  3. Введите в поле ввода запроса слово ИНТЕРНЕТ;
  4. Нажмите кнопку Find (Поиск), расположенную правее поля ввода. В нашем случае было найдено 222 вхождений, то есть значительно меньше, чем в первом случае.

Информация о работе Поисковые системы в сети интернет