Автор работы: Пользователь скрыл имя, 22 Мая 2013 в 21:08, реферат
Бурное развитие сети Internet, которое происходило на протяжении 90-х годов, обусловлено в первую очередь появлением новой технологии WWW(WorldWideWeb).
WorldWideWeb(или всемирная паутина) – это десятки миллионов Web-серверов Internet,
содержащихWeb-страницы, в которых используется технология гипертекста. Она позволяет доставлять и обрабатывать информацию, содержащуюся в специально отформатированных документах, и включает в себя три основных компонента: HypertextMarkupLahguage (HTML), HyperTextTransferProtocol (HTTP), UniversalResourceLocator (URL).
ВВЕДЕНИЕ 2
Глава1 3
1.1 История возникновения WWW 3
1.2 Понятие гипертекста 4
Глава 2 5
2.1 Краткая история развития поисковых систем Internet 5
2.2 Состав и принципы работы поисковой системы Internet 6
2.3 Основные характеристики поисковой системы Internet 8
2.4 Обзор основных Российских поисковых Internet - систем 11
Глава 3 15
3.1.Метапоисковая система Internet 15
3.2.Принцип работы метапоисковой системы 15
ЗАКЛЮЧЕНИЕ 18
Cписок источников и литературы: 19
В 1998-м году программисты, работающие в питерском офисе американской софтверной компании DataArt, создали новое ПО для почтового веб-сервера, которое в дальнейшем предполагалось продавать западным компаниям. Чтобы протестировать сервис, его временно выложили в открытый доступ для российских пользователей, а сервис вдруг стал стремительно набирать популярность.
Каждая поисковая система
имеет только свое собственное, ограниченное
ее ресурсами, множество документов,
которые доступны для поиска. Ни
одна из подобных систем не сможет охватить
всех ресурсов Интернет, поэтому в
любой момент может возникнуть ситуация,
когда информационные потребности
пользователя не смогут быть удовлетворены.
Как правило, в этом случае пользователь
переходит на другую поисковую систему
и пытается искать то, что ему
нужно, там.
Для решения данной проблемы и расширения
возможности поиска, были созданы системы,
названные метапоисковыми. Они не имеют
собственных поисковых баз данных, не
содержат никаких индексов и при поиске
используют ресурсы множества поисковых
систем. За счет этого полнота поиска в
таких системах максимальна и вероятность
нахождения нужной информации очень высока.
При проектировании метапоисковой системы
нужно решить ряд проблем.
Прежде всего, из полученного от поисковых
систем множества документов необходимо
выделить наиболее релевантные, то есть
соответствующие запросу пользователя.
Как правило, создатели метапоисковых
систем не совсем оправданно надеются,
что поисковые системы, которые они используют,
возвращают релевантные результаты поиска,
и слишком полагаются на позицию, на которой
в данной поисковой системе находится
документ.
Этот стандартный подход представлен
на рис. 1. В таких системах анализ полученных
описаний документов не производится,
что может поставить нерелевантные документы,
идущие первыми в одной поисковой системе,
выше релевантных в другой, что существенно
понизит качество самого поиска. Этот
принцип оказался хорошим при создании
автором анализатора позиции сайта в поисковых
системах, но в целом для систем метапоиска
оказался неудовлетворительным.
Схема1 Стандартная метапоисковая
система
При разработке следующего поколения
метапоисковых систем были учтены недостатки,
присущие стандартным метапоисковым системам.
Были созданы системы с возможностью выбора
тех поисковых машин, в которых, по мнению
пользователя, он с большей вероятностью
может найти то, что ему нужно (рис. 2)
Схема2. Следующее поколение
метапоисковых систем
Кроме этого, такой подход позволяет уменьшить
используемые вычислительные ресурсы
метапоискового сервера, не перегружая
его слишком большим объемом ненужной
информации и серьезно сэкономить трафик.
Здесь нужно отметить, что в любой системе
метапоиска наиболее узким местом, в основном,
является пропускная способность канала
передачи данных, так как обработка страниц
с результатами поиска, полученными от
нескольких десятков поисковых серверов,
не является слишком трудоемкой операцией,
потому что затраты времени на обработку
информации на порядки меньше времени
прихода страниц, запрошенных у поисковых
серверов.
Как пример систем, имеющих подобную организацию,
можно назвать Profusion, Ixquick, SavvySearch, MetaPing.
ЗАКЛЮЧЕНИЕ
Пополнение информационных ресурсов
Интернета происходит высокими темпами,
и найти необходимую информацию
становиться всё труднее. Различные
печатные справочники устаревают ещё
до выхода в свет. Единственным надёжным
способом поиска информации является
использование различных
1) Поисковые системы Internet, как и любые другие механизмы, имеет свои характеристики и свойства, которые частично или полностью были взяты у обычных поисковых машин, либо появились за счет специфики работы поисковых механизмов сети Internet.
2) Рассмотренные выше поисковые системы Internet далеки от совершенства.
Считается, что идеальная
поисковая машина должна
1. простота в использовании
2. чётко организованный и
3. быстрый поиск в базе данных и быстрое реагирование.
4. надёжность и точность
3) Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что базы данных не являются совершенными. Метапоисковые системы - новое направление, позволяющее получать более точный результат за меньшее время.
Internet продолжает развиваться с неослабевающей интенсивностью, стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает сложно найти необходимый документ. Постоянно обновляемые и модернизируемые поисковые системы помогают облегчить нам выполнение этой задачи.
Cписок источников и литературы:
http://citforum.ru/internet/
Глоссарий | ||
№ п/п |
Понятие |
Содержание |
1 |
2 |
3 |
1 |
Http (Hyper Text Transfer Protocol) |
это протокол передачи данных в сети интернет. С английского переводится как "протокол передачи гипертекста". Существуют клиенты, которые отправляют запросы на сервер, а сервер, который обрабатывает поступающие запросы, отвечает на них. На сегодняшний день http является одним из самых распространены протоколов интернета. |
2 |
Java-апплеты |
мобильные коды Java, ссылки на которые вмонтированы в тело документа. |
3 |
WWW (Word Wide Web- всемирная информационная сеть) |
гипертекстовая, гипермедийная, распределенная, интегрированная, глобальная, децентрализованная система, реализующая самую передовую и массовую технологию, работает по принципу клиент-сервер. |
4 |
Сервер |
компьютер, который обеспечивает работу сайта. Первоначально сервер должен передавать страницы сайта том или иному браузеру по протоколу HTTP. Кроме этого, с сервера должны запускаться все скрипты, которые используются на сайте. |
5 |
Каталоги ресурсов |
представляют собой |
6 |
Поисковые машины |
представляют собой мощные информационно-поисковые системы, размещаемые на серверах свободного доступа. |
7 |
Скрипт |
программа, которую пишут как правило на языке Perl, C, php или JavaScript. Данную программу можно вызвать из гипертекстового документа и выполнить на машине WWW-сервере. В основном применяют скрипты для того, чтобы обеспечить диалог с читателем гипертекста, а также чтобы, используя их, была возможность украсить HTML-страницы счетчиком посещений либо случайными сообщениями. |
8 |
URL |
это аббревиатура от Uniform Resource Locator (универсальный локатор ресурса). Указывает в World Wide Web местоположение файлов на других серверах сети. URL включает в себя протокол доступа, например http, ftp, telnet и т.д. |
9 |
Протокол TCP/IP |
набор протоколов IP (Internet Protocol – межсетевой протокол) и TCP (Transmission Control Protocol – протокол управления передачей). IP – обеспечивает дейтограммную доставку пакетов, основная задача – маршрутизация пакетов TCP – работает на транспортном уровне, устанавливает логическое соединение между отправителем и получателем, обеспечивает между ними сеансовую связь. |
10 |
Шлюзы |
программы, обеспечивающие взаимодействие сервера с серверами других протоколов. |
11 |
Сетевой протокол |
набор правил, позволяющий осуществлять соединение и обмен данными между двумя и более включёнными в сеть устройствами. |
12 |
telnet |
это протокол удаленного доступа. TELNET дает возможность абоненту работать на любой ЭВМ сети Интернет, как на своей собственной, то есть запускать программы, менять режим работы и так далее. На практике возможности лимитируются тем уровнем доступа, который задан администратором удаленной машины. |
13 |
HTML |
(англ. сокр. HyperText Markup Language - язык гипертекстовой разметки) На этом языке браузеру сообщается, какой именно текст и другие элементы (картинки, таблицы, формы) и каким образом нужно отображать на странице. На языке HTML не программируют, а верстают - особым образом размечают текст для публикации в интернете.
Язык HTML позволяет связывать страницы между собой с помощью ссылок (линков). Наличие ссылок является фундаментальным свойством веб-страниц. Ссылкой может являться не только некоторая часть текста, но и картинка или ее часть. |
14 |
Java |
В применении к Интернету - технология создания "апплетов": небольших программ, которые загружаются на компьютер пользователя вместе со страницей сайта и позволяют "оживлять" эту страницу. Апплеты могут обеспечивать странице дополнительную функциональность, реализовывать мультипликационную рекламу или даже представлять собой небольшую игру, встроенную в страницу сайта. |
15 |
Тэги |
Теги - это специальные команды, написанные
на HTML (Hyper Text Marker Language) - языке гипертекстовой
разметки, заключенные между двумя треугольными
скобками < >; теги бывают как парные
(например, теги <body> и </body>, при чем
<body> открывающий, а </body> - закрывающий,
т.е. отличие - в знаке "/") и не парные,
которые надо запомнить (например, тег
<br>). Тег, те́ги в SGML (в HTML, |
16 |
Сниппет |
Термин сниппет используется для небольших отрывков текста из найденной поисковой машиной страницы сайта, использующихся в качестве описания ссылки в результатах поиска. Как правило, они содержат контекст, в котором встретилось ключевое слово в тексте на странице. |
05.01.2012