История развития поисковых систем

Автор работы: Пользователь скрыл имя, 03 Декабря 2015 в 21:43, реферат

Описание работы

Каждый пользователь в Интернете может найти массу разнообразной и интереснейшей информации, а также использовать все богатейшие возможности сети. Выбранная тема реферата очень актуальна на сегодняшний день, т.к. поисковые системы не заменимы на сегодняшний день, в силу чрезвычайно частого посещения всемирной сети. Ресурсы Интернета превратившись в инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему

Содержание работы

Введение ..................................................................................................................... 3
История развития поисковых систем................................................................... 4
Как работают механизмы поиска.......................................................................... 7
Перспективы развития поисковых систем..........................................................11
Заключение ............................................................................................................... 15
Список использованных источников...................................................................... 16

Файлы: 1 файл

электронная комерция.docx

— 36.54 Кб (Скачать файл)

 

 

 

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ

ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ»

( Н И У « Б е л Г У  » )

 

 

 

ИНСТИТУТ ЭКОНОМИКИ

 

КАФЕДРА ЭКОНОМИКИ

 

 

 

 

 

 

 

 

ИСТОРИЯ ПОИСКОВЫХ СИСТЕМ В ИНТЕРНЕТЕ

 

Реферат студентки

дневного отделения 3 курса группы 06001314

Поправко Светланы Сергеевны

 

 

 

 

 

 

Проверил:

ст. преп. Сорокина Е.С.

 

 

 

 

 

 

 

 

 

 

 

 

 

БЕЛГОРОД 2015

 

 

 

 

 

 

 

 

Содержание

 

Введение ..................................................................................................................... 3

  1. История развития поисковых систем................................................................... 4

  1. Как работают механизмы поиска.......................................................................... 7

  1. Перспективы развития поисковых систем..........................................................11

Заключение ............................................................................................................... 15

Список использованных источников...................................................................... 16

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Каждый пользователь в Интернете может найти массу разнообразной и интереснейшей информации, а также использовать все богатейшие возможности сети. Выбранная тема реферата очень актуальна на сегодняшний день, т.к. поисковые системы не заменимы на сегодняшний день, в силу чрезвычайно частого посещения всемирной сети. Ресурсы Интернета превратившись в инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему. По оценке экспертов объем информации, передаваемой по каналам Интернет, удваивается каждые полгода. Ежедневно в сети появляются миллионы новых документов, и естественно, что без систем поиска они в подавляющем своем большинстве остались бы не востребованными, вообще не были бы не кем найдены, и все то огромное количество информации оказалось бы никому не нужным. Возникла необходимость создания таких средств, которые позволили бы легко ориентироваться в информационных ресурсах глобальных сетей, быстро и надежно находить нужные сведения. В интернете появились специальные поисковые средства. Еще несколько лет назад бытовало такое мнение: в Интернете есть все, но найти там ничего невозможно. Однако с появлением и быстрым развитием поисковых каталогов, поисковых машин, и всевозможных поисковых программ ситуация изменилась, и теперь в Сети срочно понадобившуюся информацию иногда можно найти быстрее, чем в книге, лежащей на столе.

К сожалению, поисковые системы часто не способны точно и справедливо интерпретировать ресурсы. Как результат, на первых позициях поиска зачастую оказываются сайты "далекие" от решаемого вопроса. При этом ресурсы представляющие реальную пользу оказываются "за бортом" поиска.

 

 

1. История развития  поисковых систем

 

Одним из первых способов организации доступа к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет.

Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время. Причина этого очень проста - даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет.

В 1997 году Сергей Брин и Лари Пейдж создали Google самую популярную на сегодняшний момент поисковую систему в мире.

23 сентября 1997 года была  официально анонсирована поисковая  система Yandex, самая популярная в русскоязычной части Интернет.

В настоящее время существует 3 основных международных поисковых системы - Google, Yahoo и MSN Search, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих можно насчитать очень много) использует в том или ином виде результаты 3 перечисленных. Например, поиск AOL (search. aol.com) и Mail.ru используют базу Google, а AltaVista, Lycos и AllTheWeb - базу Yahoo.

В России основной поисковой системой является Яндекс, за ним идут Rambler, Google.ru, Aport, Mail.ru и КМ.ru

AltaVista - поисковая система. Название "AltaVista" буквально переводится как "взгляд сверху".

Изначально, поисковая система AltaVista была настоящим новатором по созданию поисковых технологий. В 1995 году Альта виста создавалась как один из элементов оборудования исследовательской лаборатории Digital Equipment Corporation (DEC). Появившись, поисковая система AltaVista быстро получила признание пользователей и стала лидером среди себе подобных. Основной заслугой системы AltaVista считается обеспечение поддержки множества языков, в том числе китайского, японского и корейского. Действительно, в 1997 году ни одна поисковая машина в Сети не работала с несколькими языками, тем более с редкими.

В 1998 году корпорация Compaq Computer купила DEC (вместе с AltaVista). И уже в начале 1999 года AltaVista получила статус самостоятельного подразделения. В этом же году Microsoft лицензировала поисковую систему AltaVista для использования на своем узле MSN. Множество желающих сразу же стали пользоваться услугами по индексации больших объемов информации и возможностью мгновенного поиска в огромных базах данных. При этом адрес поисковой системы оставался прежним - altavista. digital.com.

А набор в адресной строке altavista.com приводил к попаданию на сайт компании AltaVista Technology. В результате, известность поисковой системы привела к огромному притоку посетителей на сайт AltaVista Technology и потере потенциальных пользователей поисковой системой. В итоге, домен altavista.com был выкуплен Compaq за 3,35 миллиона долларов в августе 1998 года (крупнейшая сделка подобного рода на тот момент). Несмотря на это, Compaq так и не удалось получить прибыль от поисковой системы. Поэтому в июне 1999 года начались переговоры Compaq и корпорации CMGI о формировании стратегического сетевого альянса, в рамках которого AltaVista была продана CMGI. 19 августа 1999 года было объявлено о приобретении корпорацией CMGI у Compaq 83 % акций AltaVista.

В феврале 2003 AltaVista была куплена Overture Services, Inc., которая в июле 2003 была приобретена Yahoo. С мая 2011 AltaVista перешла на поисковую технологию Yahoo.

Поисковая система AltaVista же стремилась стать универсальным порталом, включавшим онлайновый магазин, радиостанцию, форумы, чаты, персональные фотоальбомы и прочее. Но, из-за громадных денежных вливаний, из-за конкуренции с другими гигантскими порталами и опубликованной критики со стороны тех же конкурентов, 2001 год проходит для компании под девизом отказа от претензий на статус портала и "возвращения к истокам”.

Компания повернула свою деятельность в другое русло. Теперь www.altavista.com продвигает свою поисковую систему среди индивидуальных пользователей Интернета и лицензирует технологии поиска предприятиям, в том числе для использования во внутренних сетях. Основным же источником финансирования потребительской версии поисковой системы AltaVista стали доходы от рекламы, получаемые, в том числе и от наиболее популярных. Например, сейчас реальные результаты поиска помещаются после ссылки, за размещение которой, компании AltaVista платит владелец соответствующего ресурса.

Одновременно, с попытками стать порталом, AltaVista продолжала совершенствовать свои поисковые технологии.

Также еще одним источником прибыли AltaVista является разработка корпоративных поисковых систем внутреннего пользования.

 

 

2. Как работают  механизмы поиска

 

Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как находить и обрабатывать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы.

1. Агенты - самые "интеллектуальные" из поисковых средств. Они могут  делать больше, чем просто искать: они могут выполнять даже транзакции  от Вашего имени. Уже сейчас  они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.

2. Общий поиск информации  в Сети осуществляют программы, известные как пауки. Пауки сообщают  о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.

3. Кроулеры просматривают заголовки и возвращают только первую ссылку.

4. Роботы могут быть  запрограммированы так, чтобы переходить  по различным cсылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети, однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы.

Агенты извлекают и индексируют различные виды информации. Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Вид построенного индекса определяет, какой поиск может быть сделан поисковым механизмом и как полученная информация будет интерпретирована.

Агенты могут также перемещаться по Интернет и находить информацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.

Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные передаются базе данных.

Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.

База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие:

1. Количество слов запроса  в текстовом содержимом документа (т.е. в html-коде).

2. Тэги, в которых эти  слова располагаются.

3. Местоположение искомых  слов в документе.

4. Удельный вес слов, относительно  которых определяется релевантность, в общем количестве слов документа.

Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными (вроде AltaVista, HotBot).

5. Время - как долго страница  находится в базе поискового  сервера. Поначалу кажется, что это  довольно бессмысленный принцип. Но, если задуматься, как много  существует в Интернете сайтов, которые живут максимум месяц! Если же сайт существует довольно  долго, это означает, что владелец  весьма опытен в данной теме  и пользователю больше подойдет  сайт, который пару лет вещает  миру о правилах поведения  за столом, чем тот, который появился  неделю назад с этой же темой.

6. Индекс цитируемости - как  много ссылок на данную страницу  ведет с других страниц, зарегистрированных  в базе поисковика.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой.

Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Перспективы развития поисковых систем

 

Исследования показывают, что поисковые средства постоянно развиваются. Совершенствование идет по всем главным аспектам: рост объемов баз данных, возможности составления запроса и дружественность интерфейса, выдача результатов и наличие дополнительных сервисных функций. Системы которые долгое время не внедряют новых элементов и не оптимизируют уже имеющиеся функции постепенно выводятся из активного использования.

Информация о работе История развития поисковых систем