Автор работы: Пользователь скрыл имя, 19 Ноября 2013 в 20:46, контрольная работа
Мережа Інтернет схожа на величезну світову бібліотеку, що має тільки одна, але суттєва відмінність: для пошуку книги в бібліотеці є каталог, у крайньому випадку, можна звернутися до досвідченого бібліотекаря. Повного каталогу Інтернету не існує. Але, тим не менше, пошук в глобальної комп'ютерної мережі можливий, і це, мабуть, є однією з найбільш важливих його сторін. Для пошуку даних у мережі використовуються спеціальні сервери, інформація на яких підтримується і оновлюється практично автоматично.
Вступ
Загальні принципи інформації в мережі Інтернет
1.1 Пошук інформації в Інтернет: стратегія і методика
1.2 Пошук за допомогою каталогів
1.2.1 Принцип роботи, переваги і недоліки каталогів
1.2.2 Електронні каталоги глобального масштабу
1.2.3 Російські каталоги ресурсів Інтернет
1.3 Пошук за допомогою пошукових машин
1.3.1 Принцип роботи, переваги і недоліки пошукових машин
1.3.2 Глобальні пошукові машини
2. Основні вимоги пошуку інформації в інтернеті
2.1 Основні вимоги до пошуку
2.2 Методика пошуку інформації в Інтернеті
2.3 Розвиток інформаційного ресурсу
2.4 Вимоги до інструментів пошуку
2.5 Структура пошукових сервісів
2.6 Глобальні пошукові машини WWW
2.7 Планування пошуку
Висновок
Використана література
Всі інші російські каталоги ресурсів Інтернет демонструють ще менш якісний рівень роботи. До числа каталогів, в яких іноді можна виявити цікаві відомості, відносяться List.ru (list.mail.ru), Wеblist (Weblist.ru або http://www.yahoo.ru/), Іван Сусанін (http://www . susanin.net
1.3 Пошук за допомогою пошукових машин
1.3.1 Принцип роботи, переваги і недоліки пошукових машин
До переваг пошукових машин слід віднести наступні: мала кількість в результатах пошуку застарілих посилань; набагато більшу кількість Web-сайтів, за якими проводиться пошук; більш висока швидкість пошуку; висока релевантність пошуку, наявність додаткових сервісних функцій, що полегшують роботу користувача, наприклад, можливість перекладу тексту документа на іноземну мову, здатність виділяти всі документи з певного сайту, звуження критеріїв в ході пошуку, знаходження документів "за зразком" і т.д.
В основу роботи пошукових машин закладені абсолютно інші технологічні принципи. Завдання пошукових машин - забезпечувати детальне розвідку інформації в електронній всесвіту, що може бути досягнуто тільки за рахунок обліку (індексування) всього змісту максимально можливого числа web-сторінок. На відміну від каталогів, всі вони функціонують в автоматизованому режимі і мають однаковий принцип дії. Пошукові системи складаються з двох базових компонентів. Перший компонент являє собою програму-робот, завдання якого подорожувати з сервера на сервер, знаходити там нові чи змінились документи і викачувати їх на головний комп'ютер системи. При цьому робот, переглядаючи вміст документа, знаходить нові посилання, як на інші документи даного сервера, так і на зовнішні сайти. Програма самостійно прямує по вказаних посиланнях, знаходить нові документи і посилання в них, після чого процес повторюється знову, нагадуючи добре відомий в бібліографії "метод снігової кулі". Виявлені документи обробляються (індексуються) другим компонентом пошукової системи. При цьому, як правило, враховується весь зміст сторінки, включаючи текст, ілюстрації, аудіо-і відеофайли і пр. Індексації підлягають усі слова в документі, що якраз і дає можливість використовувати пошукові системи для детального пошуку по самій вузькій тематиці. Утворені гігантські індексні файли, що зберігають інформацію про те, яке слово, скільки разів, в якому документі і на якому сервері вживається, і coc т a вляют б a зу д a нних, до до o т opo й відбувається звернення користувачів, що вводять в рядок запиту поєднання ключових слів.
Однак у пошукових машин існують деякі недоліки: обмежена область пошуку. Якщо будь - який сайт не був внесений в б a зу д a нних п o і c до o в o ї м a шини, o н для неї не «існує», і його документи в результати пошуку потрапити не можуть; відносна складність використання . Для того щоб складений запит на пошук точно відповідав тому, що саме потрібно знайти, потрібно хоча б трохи представляти, як працює пошукова машинам, і вміти використовувати найпростіші логічні оператори. Пошукові каталоги в цьому сенсі простіше і звичніше; менш наочна форма представлення результатів запиту. Каталог видає назву сайту з його короткою анотацією і іншою корисною інформацією. Результати роботи п o і c до o в o ї м a шини м e н ee н a наочно; п oc до o льку б a зу д a нних п o і c до o в o ї м a шини поповнюють програми - роботи, нечесні власники рекламних сайтів можуть їх «обдурити», через що релевантність пошуку може бути значно знижена.
1.3.2 Глобальні пошукові машини
Лідер пошукових машин Інтернету, Google належить понад 60 % світового фінансового ринку, отже, 6 з десяти що у мережі людей звертаються для її сторінці у пошуках інформацією Інтернеті. Зараз реєструє щодня близько 50 мільйонів пошукових запитів і індексує більш як вісім мільярдів веб-сторінок.
Було розроблено 1998-го випускниками Стендфордського університету СергіємБрином іЛариПейджем, які застосували для ранжирування документів технологіюPageRank, де однією з ключових моментів є визначення "авторитетності" конкретного документа з урахуванням інформації документи, які посилаються нею. Говорячи загальними фразами, що більше документів називає даний документ і вони авторитетнішими, тим паче авторитетним даний документ стає. Кількісне значення авторитетності документа (інакше кажучи, зважене число посилань чиPageRank) належить до так званим статичним чинникам (тобто незалежних конкретного запиту) і береться до визначеннірелевантности документа конкретному запиту як ваговій коефіцієнт. Поруч із Google застосував визначеннярелевантности документа як текст самого документа, а й текст посилань нею. Ця технологія дозволила йому забезпечити видачу досить релевантних результатів і натомість інших пошуковців. Досить швидко Google став лідирувати у різних опитуваннях за таким показником, як задоволеність користувачів результатами пошуку.
Google здійснює пошук у документах понад 35 мовами, зокрема російському. Нині багато портали та в спеціалізовані сайти надають їх пошуку інформацією Інтернеті з урахуванням Google, що робить завдання успішного позиціонування сайтів в Google ще важливішої. Google проводитьпереиндексацию своєї пошукової бази приблизно разів у чотири тижня. Під час цього вдосконалення, неофіційно званого Google dance, відбувається відновлення бази з урахуванням інформації, зібраної роботами під час, що минув від попереднього вдосконалення, перерахунок значень PageRank документів. Існує також певну кількість документів з досить великою значенням PageRank, інформацію про що у пошукової базі оновлюється щодня, проте значення PageRank перераховується лише під час Google Dance.Нормированное значенняPageRank конкретної документа, завантаженого в браузер, можна почути, скачавши телефону й установивши GoogleToolBar - спеціальну панель інструментів до роботи з цимпоисковиком. Не дивлячись те що, що у пошуковику є форма для безплатного додавання сторінки до бази, Google воліє сам знаходити нових документів по посилань з роботи вже визначних акторів і нічого очікувати індексувати додану через форму сторінку, тоді як базі бракуватиме жодної сторінки,ссилающейся її у.
Yahoo
Однією з перших Пошукових систем (створена Девідом Філо і ДжерріЯнгом у квітні1994года) по сьогодні залишається найпопулярнішою їх, традиційно поєднуючи пошук, як у ключовим словами, і з допомогою ієрархічного дерева розділів.
Нинішнє розвиток Yahoo можна з'ясувати, як спрямування он-лайн, інтерактивність. Yahoo швидко освоює цю галузь Інтернет-послуг, але виникає одне питання: ядро Yahoo! був цього розраховане. Не був у 1994 року закладено у нього "онлайнова" складова, її "приклеїв" ТімКугл кількома роками пізніше. Природно виникає загроза хакерських атак цю незахищену область.
Один із нововведень пошукової системи Yahoo - панель завдань для браузериFirefox,. Цей інструмент допомагає користуватися пошуком Yahoo, не заходячи на офіційний сайт, а лише використовуючи функціональні кнопки панелі.
1 3 вересня 2005-го року розвідувач Yahoo, якому тут понад 200 мільйонів адрес електронної пошти у світі, анонсував запуск нової виборчої системи пошуку текстів, фотографій та інших документів, які у листах.
Необхідність такої нововведення виникла за збільшенням обсягу збережених даних, либонь деякі користувачі створюють цілі поштові архіви.Подгоняемий конкурентом Google та її поштовим сервісомGmail, Yahoo для зберігання пошти пропонує відтепер 1 гігабайтів безплатного місця, чи 2гигабайта по річномуабонементу. "Як ви отримуєте можливість зберігати більше інформації, вам необхідні зміни і розширені пошукові можливості", - пояснює Ерік Петерсон, аналітик компаніїJupiter Research.
Користувачі пошукової системи Yahoo, своєю чергою, зможуть тепер скористатися наявними можливостями деталізованого пошуку слів в назві чи з тексту листи, соціальній та приєднаних документах, не відкриваючи їх. Результат пошуку відбивається у трьох рядках із зазначенням всіх атрибутів. На панелі справа відбиваються все схожі документи. Знайдені фотографії виводяться на екран у зменшеному вигляді, що полегшує пошук. Система також враховує орфографічні помилки, дозволяючи шукати слова лише з першими літерами.
Спочатку Yahoo планує запропонувати нової судової системи малій кількості американських користувачів, та був поширити її у світі. З боку клієнтів це вимагатиме жодних додаткових зусиль. "Коли послуга стане, доступна, у лівій верхньому розі сторінки вашого поштової скриньки з'явиться відповідний баннер", - обіцяє компанія Yahoo.
За данимиcomScore Media Metrix в липні цього року,домену Yahoo належить 219 мільйонів адрес електронної пошти, що становить 31,5% світового фінансового ринку, поступившись лише Microsoft з 221 мільйоном користувачів сервісу Hotmail (35,5% ринку).
2 ОСНОВНІ ПРИЙОМИ ПОШУКУ ІНФОРМАЦІЇ В ІНТЕРНЕТІ
2.1 Основні вимоги до пошуку
До результатів пошуку
пред'являються вимоги повноти охоплення
ресурсів, достовірності отриманої
інформації, мінімальних витрат часу
і максимальна швидкість
Вимога повноти охоплення ресурсів не потребує додаткових поясненнях, за винятком необхідності використовувати при пошуку ресурси не тільки WWW, але й інших служб Інтернету.
Достовірність інформації, враховуючи природу Інтернету, стає надзвичайно важливою вимогою. Оцінка достовірності може здійснюватися як традиційними методами (перевірка легальності публікацій на паперових носіях, отримання відомостей про організації та авторів, з'ясування насправді їх електронних ресурсів тощо), так і з використанням можливостей Інтернету (ознайомлення з альтернативними джерелами інформації, звіряння фактичної матеріалу , встановлення частоти його використання іншими джерелами; з'ясування статусу документа та рейтингу джерела засобами пошукових систем, отримання інформації про компетентність та статус автора матеріалу за допомогою спеціальних пошукових сервісів Інтернету; аналіз окремих елементів організації сайту з метою оцінки кваліфікації підтримують його фахівців та інше).
Час пошуку, не рахуючи витрат часу, пов'язаних з технічними характеристиками підключення, в основному залежить від планування пошуку та навичок роботи фахівця з пошуку з ресурсом вибраного типу. Планування пошуку полягає у визначенні необхідних для вирішення пошукового вимоги пошукових служб та порядку їх застосування. Крім того, багато залежить від навичок і досвіду конкретного фахівця з пошуку.
Як вже зазначалося, інформація в Інтернеті доступна з джерел різного типу. Перш за все - це WWW-ресурси (гіпертекстова система, каталоги ресурсів, пошукові машини). Крім того, це вже відомі читачеві електронна пошта, поштові роботи, Usenet і інші телеконференції, а також ftp-системи та архіви (із застосуванням Gopher і Veronica). WWW дозволяє здійснювати пошук необхідних ресурсів на основі своїх гіперсвойств, тобто наявні пошукові системи працюють з використанням гіперпосилань в автоматичному режимі, не виключаючи можливості ручного перегляду. У WWW є цілий ряд пошукових сервісів як загального, так і спеціалізованого призначення.
Каталоги ресурсів являють собою бази даних з адресами ресурсів Інтернету й самими різними тематиками. Зазвичай вони мають ієрархічну структуру, звичну для користувача, і деякі засоби пошуку по ній. Ці каталоги в більшій своїй частині обслуговуються фахівцями з класифікації, тобто зумовлюється певний суб'єктивний підхід до відбору інформації, який, з одного боку, кілька гарантує достовірність інформації, але з іншого - зумовлює можливість відсутності (пропуску) частини інформації, а також се запізніле розміщення в каталозі.
Пошукові машини - це механізм автоматичної побудови посилань (індексів) на різні ресурси. Пошукові машини можуть бути орієнтовані на глобальні, спеціалізовані або локальні ресурси. По суті вони є потужними ІПС, які за допомогою спеціальних програм-роботів (так званих "павуків") постійно здійснюють автоматичний пошук необхідної інформації в Інтернеті. Створені на цій основі спеціалізовані БД забезпечують пошук інформації за запитами користувачів на основі спеціальних ІПМ. Щоправда, охоплення переглядається інформації залежить від застосовуваних алгоритмів і навіть для потужних пошукових машин залишає бажати кращого.
Електронна пошта
Поштові роботи - це спеціальні програми, здатні відповідати певними діями на команди, що надходять їм, але електронною поштою. Їх основне призначення - пересилання даних за запитом у разі, коли ті недоступні іншим способом, а також як альтернатива роботи в режимі online з будь-яким з відомих ресурсів, наприклад ftp-архівами. Адреса поштового робота має формат електронної пошти. При пошуку поштові роботи зазвичай використовуються лише як посередники при отриманні інформації. Іноді доводиться стикатися з тим, що вони виявляються єдиним засобом отримання потрібних відомостей.
Usenet і інші регіональні і спеціалізовані телеконференції представляють собою електронні "дошки оголошень", де користувач розміщує свою інформацію в одній з тематичних груп новин, переданих передплатникам відповідної тематики. Цей ресурс найбільш значущий для швидкого накопичення інформації, але вузькому питання, а для пошуку - частіше для отримання приватної, неофіційної інформації.
Ресурси, доступні за telnet,
в ряді випадків являють собою
абсолютно унікальну
Як вже зазначалося, система файлових архівів ftp має досить великі ресурси цінної інформації, до цих пір не переведеної в WWW. Архіви ftp представляють собою в першу чергу джерела отримання програмного забезпечення. Пошук в них може становити певний інтерес при знанні структури архівів; побудови файлових систем, імен файлів і тек, що містять необхідні ресурси.
2.2 Методика пошуку інформації в Інтернеті
Пошук необхідної інформації в Інтернеті можна здійснювати різними способами: