Автор работы: Пользователь скрыл имя, 24 Апреля 2013 в 15:16, курсовая работа
Поисковая система — вебсайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. В последнее время появился новый тип поисковых движков, основанных на технологии RSS.
Следует отметить, что при выполнении запроса поисковая система не ищет документ непосредственно в Интернете. Она обращается к своей базе данных. Существует два способа пополнения информации в базы данных поисковых машин:
- Разработчик Web-страницы самостоятельно добавляет ссылку на неё в поисковую систему.
- Специальная программа, называемая роботом, находит ссылку на новую страницу во Всемирной паутине.[ 1 ]
Введение 3
1. Теоретическая часть 3
1.1.Правила составления запросов к поисковым машинам 3
1.2.Классификация поисковых машин 4
1.3. Как выбрать поисковую машину 9
2. Практическая часть 11
2.1. Постановка задачи 11
2.1.1. Цель решения задачи 11
2.1.2. Условие задачи 12
2.2. Компьютерная модель решения задачи 13
2.2.1. Информационная модель решения задачи 13
2.2.2. Аналитическая модель решения задачи 14
2.2.3.Технология решения задачи 15
2.3. Результаты компьютерного эксперимента и их анализ 21
2.3.1. Результаты компьютерного эксперимента 21
2.3.2. Анализ полученных результатов 22
Заключение 23
Список использованной литературы 24
Курсовая работа
по дисциплине «Информатика»
на тему «Поиск информации в сети Интернет с использованием поисковых машин»
Исполнитель:
Григорьева Анастасия Владимировна
Специальность бакалавр экономика
Форма обучения ФНО
Номер зачетной книжки 11флд41501
Руководитель:
Доц. Лощаков Павел Анатольевич
Ярославль 2012
Содержание
Введение
Использование поисковых машин является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Cети, подлежащие детальному рассмотрению. Применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса.
Объектом работы является поисковые машины, а цель работы: изучить как составлять запрос в поисковых машинах, классификацию поисковых машин и как выбрать поисковую машину
Поисковая система — вебсайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. В последнее время появился новый тип поисковых движков, основанных на технологии RSS.
Следует отметить, что при выполнении запроса поисковая система не ищет документ непосредственно в Интернете. Она обращается к своей базе данных. Существует два способа пополнения информации в базы данных поисковых машин:
- Разработчик Web-страницы самостоятельно добавляет ссылку на неё в поисковую систему.
- Специальная программа, называемая роботом, находит ссылку на новую страницу во Всемирной паутине.[ 1 ]
Теоретическая часть
Правила составления запросов к поисковым машинам
При составлении запроса к поисковой системе нужно ответить на следующие вопросы:
Насколько точным должен быть запрос к поисковой системе? Чтобы задать запрос к поисковой системе необходимо по максимуму указать слова, которые должны присутствовать в ответе на Ваш запрос. Но мало просто перечислить слова для запроса. Может оказаться, что указанная комбинация слов отсутствует в индексе поисковой системы (при этом мы опускаем случаи, когда Вы сделали орфографическую ошибку при наборе слова). В этом случае необходимо расширить запрос, убрав из него сомнительные/не обязательные для Вас слова. Но необходимо знать, что при этом может в несколько раз увеличиться количество выдаваемой на запрос информации;
Нужно ли включать в запрос именно эти слова? Некоторые слова в языке (предлоги, союзы, междометия, частицы) не несут семантической нагрузки, а потому пропускаются поисковой системой. Поэтому такие слова (называемые также стоп-словами) будут исключаться из поиска;
Можно ли использовать
в запросе синонимы и омонимы?
Некоторые поисковые системы
нормально обрабатывает синонимы и
различные морфологические
Можно ли при поиске ограничить в использовании индексированную базу? Это бывает нужно гораздо чаще, чем Вы можете об этом думать (например, для отсева из запроса "купленных" ссылок). Многие поисковые системы позволяют ограничить индексную базу за счет опций: "поиск в найденном", "поиск в каталоге", "поиск по темам", "поиск картинок", "поиск товаров" и т.п.
Только ответив на эти вопросы, можно вплотную заняться поиском с помощью поисковых систем. [ 2 ]
Классификация поисковых машин
Яндекс
Поисковая машина Яндекс была впервые выпущена в 1997 году на выставке Softool. Отличительной чертой этой поисковой системы являлось проверять на уникальность разнообразные документы, а также вычисления ключевых свойств ядра Яндекс. Через некоторый промежуток времени появилась возможность вводить в Яндексе, поисковый запрос длинного размера (где купить телефон, какие продукты вредны для здоровья).
Вот так поисковая система Яндекс начала завоевывать авторитет, и во много раз увеличилось количество пользователей. В настоящее время поисковая система Яндекс развилась намного быстрее, чем системы конкурентов.
Яндекс создает огромное количество сервисов для своих пользователей, можно размещать свою рекламу, рекламируя свой ресурс, услугу или продукт. Также вводя в поисковую машину запрос, вы получите конкретный и исчерпывающий ответ, и потратите на это всего лишь несколько секунд.
Также можно оптимизировать сайт под Яндекс. Чтоб понять, что такое оптимизация сайта под Яндекс нужно первым делом разобраться в том, что такое оптимизация в целом. Поисковая оптимизация – это некоторые действия, которые помогут поднять позицию ресурса (сайта или блога) в результатах выдачи поисковой системы, по запросам которые вводят пользователи. Чем выше вас сайт в системе поиска, тем больше приходит на него посетителей именно с поисковой системы. При оптимизации сайта проводится некий анализ сайта, удаляются ошибки сайта, улучшается структура.[ 3 ]
Основные сервисы:
каталоги Интернет-ресурсов, бесплатная почта, бесплатный хостинг, платежная система Яндекс-деньги, сборник рефератов и др.
Бесплатная почта Яндекса имеет удобный интерфейс, гибкие настройки, обладает антиспамовым фильтром и интегрирован в систему бесплатного хостинга.
Рис1. Фото сайта Яндекс.
Google.ru — это поисковая система, которая существует с 1998 года. Google, или как некоторые не верно её называют - "гугле", является cамой успешной интернет-компанией в мире. Привёл компанию к этому долгосрочному успеху научный талант, целеустремлённость и любовь к экспериментам двух парней, в то время учащихся Стэнфорда. Сергей Брин и Ларри Пейдж сделали переворот в жизни нашего поколения.
В арсенале Google — больше сотни живых языков. Также есть мёртвые (латынь), искусственные и вымышленные. Поисковая система позволяет найти информацию на любом языке мира и сэкономить свободное время.
Адрес поисковой системы google теперь известен почти каждому, как и их новый браузер «Хром».
Поддержка множества
языков далеко не единственная причина,
по которой столь популярен
Google — та самая компания, которая решила организовать всю информацию в мире, сделала её доступной и полезной! Он ставит и решает казалось бы невозможные задачи, потому как простые задачи решать им совсем не интересно!
Поиск информации в интернете становится проще! Ведь технология поиска информации в интернете благодаря Гуглу ещё доступнее и проще. Теперь он есть в разных странах. Например, поисковая система google есть в Украине и в Казахстане — это google kz. «Гугл україна» вообще самый популярных на просторах этой страны, популярнее Яндекса и тем более Рамблера, как и зарубежом. Google ru — это поисковая система, которая является единственным прямым конкурентом для Яндекса на данный момент в рунете. Время покажет, кто будет популярнее через 5−10 лет.
Не менее интересна и история яндекс поиска, конечно, они вдохновлялись у западной ПС, но создали свой продукт, доминирующий на просторах русского интернета. При этом индексация сайта в гугле происходит в десятки раз быстрее на данный момент, будем надеятся что скоро изменится и это.
В любом случае следует производить качественную настройку движка блог, wordpress плагинов и самих статей. Обе поисковые системы любят, когда сайты делаются для людей.
Рис.2 Фото сайта Google
Yahoo!
Yahoo! (http://www.Yahoo.com) — старейшая поисковая система World Wide Web, начавшая работу еще в 1994 году.
Интерфейс Yahoo! довольно аскетичен — как и набор возможностей. Страница расширенного поиска (доступна с адреса http://search.Yahoo.com/ search/options?p; чтобы активизировать все средства, не забудьте нажать на ссылку «More options») предоставляет «джентльменский набор» средств поисковых систем — поиск по слову, фразе, ограничение выдаваемых результатов по языку web-страниц, Интернет-узлу (то есть поиск страниц только на том или ином сайте), их дате обновления, стране «местопребывания» (то есть географическому расположению сервера хостинга этих web-страниц), а также поиск web-страниц со ссылками на тот или иной адрес. Ничего более — ни поиска картинок, ни «восстановления текста», ни поиска в новостных группах — Yahoo! не предоставляет.
К сожалению, Yahoo! выдает результаты запроса несколько тенденциозно — первыми среди них оказываются ссылки на сайты, владельцы которых Yahoo! за них заплатили (платят, кстати, довольно много — около десятка центов за каждый совершенный посетителем переход по ссылке в результатах поиска). Кроме того, как это ни странно, но сфера охвата Интернета у Yahoo! не очень высока — во всяком случае, меньше, чем у Google.[ 4 ]
Тем не менее компания Yahoo! сегодня является одной из крупнейших интернет-компаний в мире. Она владеет целым рядом популярных сервисов, включая вторую в мире (по популярности) поисковую систему, самый известный фотохостинг Flickr, почтовую службу, новости, виджеты, закладки, финансовую аналитику и многое другое. По сути, Yahoo! сегодня является главным конкурентом Google на рынке контекстной рекламы. А ведь когда-то эта компания была лидером на поисковом рынке. О том, как проходило становление компании Yahoo!, и о том, как она растеряла все свое преимущество я и расскажу вам сегодня. [ 5 ]
Рис.3 Фото сайта Yahoo!
Как выбрать поисковую машину
При поиске в
интернете важны две
1. Обхват и глубина.
Под охватом имеется в виду объем
базы поисковой машины: который измеряется
тремя показателями - общим объемом
проиндексированной информации, количеством
уникальных серверов и количеством
уникальных документов. Под глубиной
понимается – существует ли ограничение на количество
страниц или на глубину вложенности директорий
на одном сервере.
2. Скорость обхода и актуальность ссылок
Скорость обхода Сети показывает, насколько
быстро происходит индексация свеже-добавленного
ресурса и насколько быстро обновляется информация в базе.
Важным показателем качества поисковой
машины (ее робота) является не только
"захват" новых территорий: но и отслеживание
состояния уже охваченных. Сервера исчезают
и появляются, страницы на них обновляются.
Ссылки, которые выдает поисковая машина
в списке найденного, должны, во-первых,
существовать, и, во-вторых, их содержание
должно соответствовать запросу.
3. Качество поиска (субъективный показатель)
Каждая поисковая машина имеет
свои алгоритм сортировки результатов
поиска. Чем ближе к началу списка оказывается
нужный вам документ, тем лучше работает
релевантность.
Пользовательские характеристики:
1. Скорость поиска
Если поисковая машина отвечает
медленно, работать с ней неэффективно. Стоит добавить, что видимая
пользователю скорость зависит не только
от самой поисковой машины, но и от Интернет-каналов.
2. Поисковые возможности (работа с языком документа, язык запросов)
Еще один пункт сравнения – что
именно и как поисковая машина
вносит в индекс. Полнотекстовая
поисковая машина индексирует все слова
видимого пользователю текста. Наличие
морфологии дает возможность находить
искомые слова во всех склонениях или
спряжениях. Кроме этого, в языке HTML существуют
тэги, которые также могут обрабатываться
поисковой машиной (заголовки, ссылки,
подписи к картинкам и т.д.).
Язык запросов в виде стандартных логических
операторов (И, ИЛИ, НЕ) есть практически
у всех машин. Некоторые умеют искать словосочетания
или слова на заданном расстоянии – это
часто важно для получения разумного результата.
Дополнительной возможностью является
поиск в зонах документа – заголовках,
ссылках, ключевых словах (META KEYWORDS) и т.д.
Дополнительная возможность языка запросов
– естественно-языковый запрос, который
не требует знания операторов.
3. Дополнительные удобства
Это дополнительные возможности, которые
предоставляет пользователям
Практическая часть
2.1. Постановка задачи
Информация о работе Поиск информации в сети Интернет с использованием поисковых машин