Автор работы: Пользователь скрыл имя, 24 Марта 2013 в 20:48, контрольная работа
Став полноправными пользователями Интернета, мы получаем доступ к огромному числу информационных ресурсов. Например, количество имеющихся в Сети HTML-документов измеряется уже не десятками, а сотнями миллионов. А ведь в Интернете можно найти не только текст, но и программы, изображения, звуковые файлы и т. д. С одной стороны, в этом море информации наверняка найдется и та, которой мы интересуемся, даже если сфера наших интересов весьма специфична. С другой стороны, найти среди сотен миллионов Web-страниц именно те, которые нам интересны, — задача не из легких. Облегчить пользователям Сети поиск необходимой информации призваны поисковые системы.
17. Поиск информации в сети Интернет (поисковые серверы сети интернет)
47. Закон Российской Федерации « О правовой охране программ для электронных вычислительных машин и баз данных»
Список литературы…
Содержание
17. Поиск информации в
сети Интернет (поисковые серверы
сети интернет)………………………………………… |
3 |
47. Закон Российской Федерации
« О правовой охране программ
для электронных |
|
Список литературы………………………………… |
|
17. Поиск информации в сети Интернет (поисковые серверы сети интернет).
Став полноправными
Информационно-поисковые
В настоящее время в развитии
поисковых систем наблюдается тенденция
объединения автоматических индексных
поисковых машин и составляемых
вручную каталогов Интернет-
Каждая поисковая система
Сетевые информационные ресурсы.
По способу организации и хранения информации ее источники в Интернете можно разделить на следующие основные категории:
- файловые серверы — являются традиционным способом хранения данных и представляют собой компьютеры, часть дискового пространства которых доступна через Интернет. Доступ к данным на таком сервере осуществляется с помощью специальных программ, поддерживающих протокол передачи файлов — FTP. Данный протокол в общем случае требует авторизации, то есть идентификации пользователя. Для осуществления доступа к файлам со стороны произвольного пользователя Сети обычно используется так называемый анонимный вход под регистрационным именем anonymous, для которого пароль не требуется. Этот протокол поддерживается всеми стандартными браузерами;
- web-сайты являются сегодня основным и наиболее распространенным типом информационных ресурсов в Сети. Сайт может содержать информацию, представленную в самой произвольной форме: графической, звуковой, видеоизображения и т. д.;
- телеконференции могут являться источником необходимой информации, как правило, носящей неофициальный характер. Телеконференции представляют собой способ общения людей, имеющих доступ в Сеть, и предназначены для обсуждения каких-либо вопросов или распространения информации. Они позволяют добиться обратной связи со множеством лиц и произвести детальное обсуждение какой-либо проблемы территориально разобщенными людьми;
- базы данных могут содержать самую произвольную информацию: публикации, справочную информацию, другие данные. Наиболее широко распространен способ доступа к базам данных через стандартные браузеры, так как он обеспечивает максимальную потенциальную аудиторию потребителей информации. Наряду с непосредственным извлечением информации из баз данных широко используется динамическое построение web-страниц в процессе исполнения пользовательских запросов.
Все названные ранее источники можно классифицировать по ряду признаков:
- по языковому признаку — в силу историко-географических причин наиболее распространенным языком в Интернете является английский, однако в Сети представлены практически все основные языки мира и, как отмечают исследовательские компании, их доля постоянно растет. Часто встречается ситуация, когда сайт поддерживают одновременно несколько языков — на выбор пользователя;
- по географическому признаку — у информационных ресурсов обычно есть своя целевая аудитория, и ее местонахождение часто может быть сопоставлено с каким-то географическим регионом. Следует заметить, что территориальное разделение не относится к возможности доступа к ресурсам, который может быть осуществлен из любой точки земного шара;
-по виду и характеру представляемой информации (новости, рекламная информация, тематическая информация, справочная информация) — это наиболее важное, с практической точки зрения, разделение по виду и характеру представляемой информации, поскольку именно информационное наполнение в конечном итоге оказывается решающим при отборе источников. В то же время как раз этот аспект может являться наиболее трудно формализуемым по причине неоднородности представляемой информации.
Средства поиска информации
По принципу организации и использования средства поиска можно выделить следующие инструменты:
- поисковые машины — являются ключевым инструментом поиска информации, поскольку содержат индексы большинства web-серверов Интернета. Однако именно это достоинство оборачивается их главным недостатком. На любой запрос они выдают обычно чрезмерно большое количество информации, среди которой только незначительная часть является полезной, после чего требуется значительный объем времени для ее извлечения и обработки;
- мета-средства поиска — позволяют ускорить выполнение запроса путем передачи аргументов поиска, то есть ключевых слов, одновременно нескольким поисковым системам. При значительном ускорении процесса и увеличении охвата поиска, этот способ имеет ряд недостатков, связанных с необходимостью координации во времени поступления результатов обработки запроса от нескольких систем, а также тем, что они не позволяют использовать возможности языка запроса каждого из применяемых поисковых средств;
- специализированные средства поиска — представляют собой «программы-пауки», которые в автоматическом режиме просматривают web-страницы, отыскивая на них нужную информацию. Механизм их работы близок к механизму, который используют поисковые системы для построения своих индексных таблиц. Выбор между первыми и вторыми представляет собой классический выбор между применением универсальных или специализированных средств;
- каталоги — как и поисковые машины, используются посетителями Интернета для нахождения необходимой информации. Каталог представляет собой иерархически организованную структуру, в которую данные заносится по инициативе пользователей. Как следствие, объем информации в них несколько ограничен по сравнению с поисковыми системами, но в то же время более упорядочен благодаря лежащей в их основе иерархической тематической структуре.
Методы поиска информации
Более или менее серьезный подход к любой задаче начинается с анализа возможных методов ее решения. Поиск информации в Интернете может быть произведен при помощи двух основных методов, которые, в зависимости от его целей и задач, могут быть использованы по отдельности или в комбинации друг с другом:
· использование поисковых систем — сегодня этот метод является одним из основных при проведении предварительного поиска. Его применение основано на ключевых словах, которые передаются системе в качестве аргумента поиска. Результатом является список ресурсов Интернета, подлежащих детальному рассмотрению. Получение наиболее релевантного результата требует проведения предварительной работы по составлению тезауруса;
· поиск по гипертекстовым ссылкам — поскольку все сайты Интернета связаны между собой гиперссылками, поиск информации может быть произведен путем последовательного просмотра с помощью браузера связанных ссылками web-страниц. К этому виду поиска также относится использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников. Такой метод наиболее трудоемок, однако «ручной» просмотр web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, требующего глубокого анализа. Он может быть также более эффективен при проведении повторных циклов или просмотре вновь образованных ресурсов.
Поиск с использованием поисковых машин.
Наиболее широко используемым,
но в то же время наиболее сложным
является метод поиска с использованием
поисковых систем. Его широкая
распространенность обусловлена тем,
что поисковые системы содержат
в себе индексы громадного количества
сайтов и при правильно сформированном
запросе можно сразу же получить
ссылки на интересующие ресурсы. Сложность
метода состоит в том, что для
того, чтобы результат был
Отбор поисковых систем.
Данный этап требует установить
последовательность использования
поисковых машин в соответствии
с убыванием ожидаемой
Составление и выполнение запросов к поисковым машинам.
Это наиболее сложный и
трудоемкий этап, связанный с обработкой
значительного количества информации,
большая часть которой обычно
является шумовой. На основе тезауруса
формируются запросы к
Как формат, так и семантика запросов может варьироваться в зависимости от применяемой поисковой машины и конкретной предметной области. Запросы должны составляться так, чтобы область поиска была максимально конкретизирована и сужена, то есть предпочтение следует отдавать использованию нескольких узких запросов по сравнению с одним расширенным. В общем случае для каждого основного понятия из тезауруса готовится отдельный пакет запросов. Так же производится их пробная реализация — как для уточнения и пополнения тезауруса, так и с целью отсечения шумовой информации.
Языки запроса различных
машин поиска в основном являются
сочетанием следующих функций:
· осуществление поиска документов при
помощи операторов булевой алгебры AND,
OR, NOT. AND (И) — содержащих все термины, соединенные
им, OR (ИЛИ) — искомый текст должен содержать
хотя бы один из терминов, соединенных
данным оператором; NOT (НЕ) — поиск документов,
в тексте которых отсутствуют термины,
следующие за данным оператором;
· осуществление поиска документов при
помощи операторов расстояния, ограничения
порядка следования и расстояния между
словами. NEAR — второй термин должен находиться
на расстоянии от первого, не превышающем
определенного числа слов; FOLLOWED BY — термины
следуют в заданном порядке; ADJ — термины,
соединенные оператором, являются смежными;
· возможность усечения терминов — использование
символа * вместо его окончания термина;
позволяет включить в искомый список все
слова, производные от его начальной части
шаблона;
· учет морфологии языка — машина автоматически
учитывает все формы данного термина,
возможные в языке, на котором ведется
поиск;
· возможность поиска по словосочетанию,
фразе;
· ограничение поиска элементом документа
(слова запроса должны находиться именно
в заголовке, первом абзаце, ссылках и т. д.);
· ограничение по дате опубликования документа;
· ограничение на количество совпадений
терминов;
· возможность поиска графических изображений;
· чувствительность к строчным и прописным
буквам.
Информация о работе Контрольная работа по "Авторскому праву"