Все пользователи
сети могут получить:
- доступ к информационным ресурсам узлов сети (доступ к файловым библиотекам, базам данных, электронным справочникам и т.п.).
- доступ к вычислительным ресурсам узлов сети (например, использование удаленного компьютера с мощным процессором для решения сложной вычислительной задачи).
- доступ к аппаратным ресурсам сети (сетевым принтерам, дискам и т.п.).
- возможность удалённого управления процессами (управление сборочной линией, реактором и т.п.).
Компьютерные сети можно классифицировать
по различным признакам.
I. По принципам
управления:
1. Одноранговые - не имеющие выделенного
сервера. В которой функции управления
поочередно передаются от одной рабочей
станции к другой;
2. Многоранговые - это сеть, в
состав которой входят один
или несколько выделенных серверов.
Остальные компьютеры такой сети
(рабочие станции) выступают в
роли клиентов.
II. По способу
соединения:
1. "Прямое соединение"- два
персональных компьютера соединяются
отрезком кабеля. Это позволяет
одному компьютеров (ведущему) получить
доступ к ресурсам другого
(ведомого);
2. "Общая шина" - подключение
компьютеров к одному кабелю;
3. "Звезда" - соединение через
центральный узел;
4. "Кольцо" - последовательное
соединение ПК по двум направлениям.
III. По охвату
территории:
1. Локальная сеть (сеть, в которой
компьютеры расположены на расстоянии
до километра и обычно соединены
при помощи скоростных линий
связи.) - 0,1 - 1,0 км; Узлы ЛВС находятся
в пределах одной комнаты, этажа,
здания.
2. Корпоративная сеть (в пределах
находятся в пределах одной
организации, фирмы, завода). Количество
узлов в КВС может достигать
нескольких сотен. При этом в состав
корпоративной сети обычно входят не только
персональные компьютеры, но и мощные
ЭВМ, а также различное технологическое
оборудование (роботы, сборочные линии
и т.п.).
Корпоративная
сеть позволяет облегчить руководство
предприятием и управление технологическим
процессом, установить четкий контроль
за информационными и производственными
ресурсами.
3. Глобальная сеть (сеть, элементы
которой удалены друг от друга
на значительное расстояние) - до
1000 км.
В качестве
линий связи в глобальных сетях
используются как специально проложенные
(например, трансатлантический оптоволоконный
кабель), так и существующие линии
связи (например, телефонные сети). Количество
узлов в ГВС может достигать
десятков миллионов. В состав глобальной
сети входят отдельные локальные
и корпоративные сети.
4. Всемирная сеть - объединение
глобальных сетей (Internet).
Для работы сети необходимо иметь:
- компьютеры,
- линии связи;
- устройства для приема и передачи.
Основные характеристики линий
связи:
- скорость передачи данных (пропускная способность)- измеряется числом передаваемых бит в секунду;
- надежность - способность передавать информацию без искажений и потерь;
- стоимость;
- резервы развития.
Основным
каналом связи и соответственно
обмена информацией в настоящее
время является телефонная линия, как
самая дешевая и доступная. Но
могут использоваться и другие беспроводные
линии связи (радиосвязь, в том
числе спутниковая, оптоволоконная
связь).
Первые вычислительные сети создавались
для решения двух задач:
1. Необходимость обеспечить быстрый и
надежный обмен информацией между ЭВМ.
Использовать для этого перфоленты и перфокарты
(физические носители) очень неудобно.
2. Существовали задачи, для решения
которых требовалось очень много
времени. Они могли быть решены
только с использованием нескольких
ЭВМ в сети.
Международная
компьютерная сеть Интернет (Internet) обязана
своим рождением военному проекту,
выполняемому в середине 60-х годов
под руководством американского
Агентства перспективных исследований
Министерства обороны. Целью этого
проекта было объединение внутренних
(локальных) сетей ряда исследовательских
лабораторий и университетов
США, работающих на оборону, в единую
специализированную компьютерную сеть.
Лекция 3
Получение информации
из Интернета
Поиск информации
в Интернете. Как говорилось ранее, одним из основных
аспектов проведения вторичных маркетинговых
исследований при помощи Интернета является
поиск источников информации. Сотни миллионов
сайтов, находящихся сегодня в Сети делают
поставленную задачу достаточно сложной.
Для того чтобы облегчить этот процесс
и сделать его более эффективным, в данном
разделе описывается подход к решению
задачи поиска информации в Интернете.
Для получения
качественного результата при проведении
поиска необходимо соблюдать ряд
условий. Основными из них являются
контроль полноты охвата ресурсов и
достоверности найденной информации.
Прежде
всего, возможность нахождения той
или иной информации в Сети определяется
полнотой охвата ее ресурсов. Зачастую
проведение поиска требует задействования
максимального объема возможных источников,
в роли которых могут выступать не только
web-сайты, но и базы данных, региональные
телеконференции, FTP-архивы и т. д. При этом
необходимым условием успешного планирования
и проведения поисковых работ становится
знание всех основных существующих на
сегодняшний день типов ресурсов Интернета,
понимание технической и тематической
специфики их информационного наполнения
и особенностей доступа к ним.
Наряду
с полнотой охвата ресурсов, качество
проводимого поиска определяется достоверностью
найденной информации. Контроль ее
достоверности может производиться
разными способами, в которые
входит нахождение и сверка с альтернативными
источниками информации, установление
частоты его использования другими
источниками, выяснение статуса
документа и сайта, на котором
он находится, получение сведений о
компетентности и положении автора
материала и ряд других.
Проблема
определения достоверности информации,
размещаемой в Интернете, выходит
за пределы рассмотрения в рамках
данной книги, поэтому основное внимание
будет уделено вопросу ее поиска.
Сетевые
информационные ресурсы. По способу организации и хранения информации
ее источники в Интернете можно разделить
на следующие основные категории:
- файловые серверы — являются традиционным способом хранения данных и представляют собой компьютеры, часть дискового пространства которых доступна через Интернет. Доступ к данным на таком сервере осуществляется с помощью специальных программ, поддерживающих протокол передачи файлов — FTP. Данный протокол в общем случае требует авторизации, то есть идентификации пользователя. Для осуществления доступа к файлам со стороны произвольного пользователя Сети обычно используется так называемый анонимный вход под регистрационным именем anonymous, для которого пароль не требуется. Этот протокол поддерживается всеми стандартными браузерами;
- web-сайты являются сегодня основным и наиболее распространенным типом информационных ресурсов в Сети. Сайт может содержать информацию, представленную в самой произвольной форме: графической, звуковой, видеоизображения и т. д.;
- телеконференции могут являться источником необходимой информации, как правило, носящей неофициальный характер. Телеконференции представляют собой способ общения людей, имеющих доступ в Сеть, и предназначены для обсуждения каких-либо вопросов или распространения информации. Они позволяют добиться обратной связи со множеством лиц и произвести детальное обсуждение какой-либо проблемы территориально разобщенными людьми;
- базы данных могут содержать самую произвольную информацию: публикации, справочную информацию, другие данные. Наиболее широко распространен способ доступа к базам данных через стандартные браузеры, так как он обеспечивает максимальную потенциальную аудиторию потребителей информации. Наряду с непосредственным извлечением информации из баз данных широко используется динамическое построение web-страниц в процессе исполнения пользовательских запросов.
Все названные
ранее источники можно классифицировать
по ряду признаков:
- по языковому признаку — в силу историко-географических причин наиболее распространенным языком в Интернете является английский, однако в Сети представлены практически все основные языки мира и, как отмечают исследовательские компании, их доля постоянно растет. Часто встречается ситуация, когда сайт поддерживают одновременно несколько языков — на выбор пользователя;
- по географическому признаку — у информационных ресурсов обычно есть своя целевая аудитория, и ее местонахождение часто может быть сопоставлено с каким-то географическим регионом. Следует заметить, что территориальное разделение не относится к возможности доступа к ресурсам, который может быть осуществлен из любой точки земного шара;
- по виду и характеру представляемой информации (новости, рекламная информация, тематическая информация, справочная информация) — это наиболее важное, с практической точки зрения, разделение по виду и характеру представляемой информации, поскольку именно информационное наполнение в конечном итоге оказывается решающим при отборе источников. В то же время как раз этот аспект может являться наиболее трудно формализуемым по причине неоднородности представляемой информации. Например, один и тот же web-сайт может содержать информацию самых разных видов. Поэтому приведенное разделение на подгруппы в достаточной степени условно.
Средства
поиска информации. По принципу организации и использования
средства поиска можно выделить следующие
инструменты:
- поисковые машины — являются ключевым инструментом поиска информации, поскольку содержат индексы большинства web-серверов Интернета. Однако именно это достоинство оборачивается их главным недостатком. На любой запрос они выдают обычно чрезмерно большое количество информации, среди которой только незначительная часть является полезной, после чего требуется значительный объем времени для ее извлечения и обработки;
- мета-средства поиска — позволяют ускорить выполнение запроса путем передачи аргументов поиска, то есть ключевых слов, одновременно нескольким поисковым системам. При значительном ускорении процесса и увеличении охвата поиска, этот способ имеет ряд недостатков, связанных с необходимостью координации во времени поступления результатов обработки запроса от нескольких систем, а также тем, что они не позволяют использовать возможности языка запроса каждого из применяемых поисковых средств;
- специализированные средства поиска — представляют собой «программы-пауки», которые в автоматическом режиме просматривают web-страницы, отыскивая на них нужную информацию. Механизм их работы близок к механизму, который используют поисковые системы для построения своих индексных таблиц. Выбор между первыми и вторыми представляет собой классический выбор между применением универсальных или специализированных средств;
- каталоги — как и поисковые машины, используются посетителями Интернета для нахождения необходимой информации. Каталог представляет собой иерархически организованную структуру, в которую данные заносится по инициативе пользователей. Как следствие, объем информации в них несколько ограничен по сравнению с поисковыми системами, но в то же время более упорядочен благодаря лежащей в их основе иерархической тематической структуре.
Методы
поиска информации. Более или менее серьезный подход к любой
задаче начинается с анализа возможных
методов ее решения. Поиск информации
в Интернете может быть произведен при
помощи двух основных методов, которые,
в зависимости от его целей и задач, могут
быть использованы по отдельности или
в комбинации друг с другом:
- использование поисковых систем — сегодня этот метод является одним из основных при проведении предварительного поиска. Его применение основано на ключевых словах, которые передаются системе в качестве аргумента поиска. Результатом является список ресурсов Интернета, подлежащих детальному рассмотрению. Получение наиболее релевантного результата требует проведения предварительной работы по составлению тезауруса;
- поиск по гипертекстовым ссылкам — поскольку все сайты Интернета связаны между собой гиперссылками, поиск информации может быть произведен путем последовательного просмотра с помощью браузера связанных ссылками web-страниц. К этому виду поиска также относится использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников. Такой метод наиболее трудоемок, однако «ручной» просмотр web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, требующего глубокого анализа. Он может быть также более эффективен при проведении повторных циклов или просмотре вновь образованных ресурсов.
Поиск с
использованием поисковых машин. Наиболее
широко используемым, но в то же время
наиболее сложным является метод поиска
с использованием поисковых систем. Его
широкая распространенность обусловлена
тем, что поисковые системы содержат в
себе индексы громадного количества сайтов
и при правильно сформированном запросе
можно сразу же получить ссылки на интересующие
ресурсы. Сложность метода состоит в том,
что для того, чтобы результат был качественным,
необходимо уметь выбрать наиболее подходящие
поисковые системы, правильно формулировать
запросы к ним, учитывать их особенности
и функциональные возможности.
Двоякая характеристика
данного метода связана с тем,
что проведение эффективного поиска
требует одновременного решения
двух противоположных задач: увеличении
охвата с целью извлечения максимального
количества значимой информации и уменьшении
охвата с целью минимизации шумовой
информации. Нетрудно увидеть, что одновременно
осуществить и то и другое довольно
сложно, хотя найти оптимальное соотношение
все-таки возможно.
Составление
тезауруса. Для эффективного использования поисковых
серверов, прежде всего необходим список
ключевых слов, организованный с учетом
семантических отношений между ними, то
есть тезаурус.