Поисковые системы Internet

Автор работы: Пользователь скрыл имя, 27 Февраля 2013 в 17:44, лабораторная работа

Описание работы

Программы, которая называются спайдер (spider). Эта программа формирует базу данных о содержимом Web-страниц. Она автоматически по заданным алгоритмам обходит Web-серверы и выбирает Web-страницы, используя найденные на них гиперссылки. После чего происходит формирование базы данных (БД), которая называется индексы поисковой системы, и в которой сохраняются сведения о содержимом и URL-адресах документов.

Файлы: 1 файл

Лабораторная работа 1.doc

— 44.50 Кб (Скачать файл)

Лабораторная работа №1

Тема: Поисковые системы Internet

2.1 Краткие  теоретические сведения

Несмотря на разнообразие представленных в Internet серверов, можно  выделить две основные группы:

  • Серверы управления трафиком;
  • Конечные серверы.

Такое распределение связано с логикой навигации в среде Internet. Сначала пользователь  с помощью серверов первой группы может найти необходимые ресурсы, а потом уже ими пользоваться.

Рассмотрим  серверы первой группы.

1) Поисковые системы. Задача поисковых систем – указать пользователю адреса Web-страниц, содержание которых соответствует запросу пользователя. Поисковая система состоит из трех составляющих:

  • Программы, которая называются спайдер (spider). Эта программа формирует базу данных о содержимом Web-страниц. Она автоматически по заданным алгоритмам обходит Web-серверы и выбирает Web-страницы, используя найденные на них гиперссылки. После чего происходит формирование базы данных (БД), которая называется индексы поисковой системы, и в которой сохраняются сведения о содержимом и URL-адресах документов.
  • Индексы поисковой системы – огромная база данных с информацией об адресах и содержимом Web-страниц.
  • Поисковая программа, которая осуществляет поиск по индексам в соответствии с запросом пользователя. Пользователь, задавая в запросе ключевые слова, получает в результате подбор ссылок на документы, содержание которых удовлетворяет критерию поиска.

Яркими представителями поисковых  систем являются:

  • Международные – http://www.altavista.digital.com

   -  http://www.infoseek.com

  • Российские – Рамблер – http://www.rambler.ru

Яndex – http://yandex.ru

Апорт – http://www.aport.ru

Сайт поисковой системы содержит текстовое поле, в котором пользователь вводит запрос на поиск информации, и кнопку, которая инициирует поиск.

Чтобы запустить процедуру поиска, надо активизировать Web-браузер и задать адрес поискового сервера. После загрузки следует ввести ключевые слова и нажать клавишу Enter. Автоматически подключенная поисковая программа пересматривает БД сервера и, найдя ключевое слово в очередной записи о Web-странице, заносит ее адрес в перечень результатов поиска. Теперь для просмотра содержания найденных файлов необходимо дважды щелкнуть мышью на гиперссылку. Поиск можно также выполнить в окне браузера. Для этого, активизируют кнопку Поиск, а затем в левой части окна среди перечня выбирают соответствующий поисковый сервер.

В каждой поисковой системе работает собственная программа поиска, поэтому  запрос по определенным ключевым словам или выражениям в каждой из поисковых  систем обычно порождает разные результаты. Соответственно и правила записи в запросе ключевых слов для поиска несколько отличаются. На каждом поисковом сайте обязательно имеется помощь по правилам записи запроса.

При составлении запроса  желательно указывать несколько  слов или словосочетание, которые  характеризуют нужную вам информацию. Имена прилагательные могут значительно уточнить требуемую вам информацию и сузить область поиска.

2) Вторая группа поисковых систем  – это каталоги ресурсов Internet, в которые информация заносится специалистами после ее анализа и классификации. Такие системы содержат тематически структурированные аннотации к Web-серверам и отдельным Web-сайтам или перечни адресов серверов с указанием их названий. Поиск осуществляется пользователем вручную по иерархически организованной тематической структуре каталога. Известными каталогами являются: http://www.yahoo.com/  - король каталогов, существующий с 1994 года и содержащий более полумиллиона страниц, Российские каталоги - http://www.stars.ru - «Созвездие Интернет», http://www.au.ru - «Ау!», Украинские - www.topping.com.ua, www.atlas-ua.net.

К группе конечных серверов относят такие, которые предоставляют различного рода информацию, например, в виде документации, информации о фирмах и услугах, которые они предлагают, информации о продаже товаров, художественных произведений и т.п. Серверы присутствия в Internet обеспечивают виртуальное присутствие фирмы и ее деятельности в Internet. Серверы этого типа можно разделить на рекламные серверы и информационные. Но четкую границу между ними провести довольно тяжело. Примером сервера, который предоставляет информацию и имеет довольно сложную организацию, является сервер Украинских железных дорог (www.uz.gov.ua). Среди информационных серверов встречаются платные. В этом случае для доступа к информации пользователи платят определенную сумму. Это, во-первых, серверы, предоставляющие финансовую информацию, и, во-вторых, информацию о рынке, то есть о фирмах, их продукции и услугах с возможностью проведения выборок по регионам, отраслям и т.д. Среди российских серверов ведущее место по предоставлению финансовой информации занимает сервер РИА «РосБизнес-Консалтинг» ( http://www.rbc.ru ).Он предоставляет самый большой объем финансовой и аналитической информации по России и СНГ. Другим примером Web-сервера, предоставляющего информацию по широкому спектру рыночных отношений, фирмах и товарах, является Web-сервер Информационная Коммерческая Система «Международные Информационные Рынки» (ИКС МИР, http://www.icsmir.ru/ ).

К группе конечных серверов относят  также интерактивные магазины, Интернет-витрины и торговые автоматы. Интерактивные магазины, то есть магазины, работающие в системе on-line, - это Web-сервер, обеспечивающий продажи посредством Интернет с использованием электронного каталога или другого вида представления продукции. Число продуктов, представляемых или продаваемых на одном сервере, может достигать нескольких сотен. Потребители могут заказывать товары через заполнение формы, процедуру регистрации или другими методами. Отличительной чертой магазина в среде Интернет является то, что интерактивный магазин может предложить значительно большее количество товаров и услуг и обеспечить большим объемом информации.

2.2 Задание  к лабораторной работе

  1. Осуществить поиск автомобильных  фирм, которые торгуют автомобильными запчастями и агрегатами, в различных городах России, просмотреть прайс-листы этих фирм, и сравнить цены на них. (Комплектующие выбираем по указанию преподавателя: например, поршни, вкладыши, карбюраторы, фильтры и т.д.).
  2. Найти оптимальный маршрут путешествия по железной дороге из Омска в указанный город России. Выяснить какими поездами, в какое время можно уехать, в каком пункте лучше всего делать пересадку, если нет прямого маршрута, выяснить стоимость билетов. (Город выбираем по указанию преподавателя: Новосибирск, Кемерово, Москва, Калининград).
  3. Найти в Internet литературу по интересующей вас тематике. Поиск осуществлять по бесплатным электронным библиотекам и по электронным книжным магазинам. Тема должна иметь отношение к учебе.
  4. Найти в Internet рефераты по темам, которые вы сейчас изучаете по разным предметам. Оценить качество найденных рефератов. Предлагаемые темы рефератов:
    • Бизнес в Internet;
    • Электронные деньги и их использование в Internet;
    • Образование в Internet.

2.3  Контрольные  вопросы

  1. Назовите три составляющие любой поисковой системы.
  2. Что такое каталоги? Как они формируются? Как осуществляется поиск нужной информации по каталогам?
  3. Назовите основные сервисы, присутствующие на порталах.
  4. Что означает поиск с учетом морфологии языка?
  5. Как поисковые системы обрабатывают «стоп-слова» - предлоги, частицы, союзы?
  6. Какие логические операторы можно использовать при задании условий поиска, как это делать?

Информация о работе Поисковые системы Internet