Автор работы: Пользователь скрыл имя, 09 Декабря 2012 в 10:21, курс лекций
Временем появления на Земле вида «человек разумный» вполне можно считать тот момент, когда представители этого вида стали собирать, осмысливать, обрабатывать, хранить и передавать разнообразную информацию. Таким образом, человечество (социум) постоянно имеет дело с информацией.
Строгого научного определения понятия «информация» нет. Существует более 300 толкований этого термина.
Ищете картинки? AltaVista может искать текст в элементах <image>. По запросу image :comet.jpg вам будут выданы все страницы, содержащие отсылку к файлу "comet.jpg" в элементе <image>, и можно смело биться об заклад, что файл с таким именем будет картинкой, изображающей комету.
Пользуйтесь обычным английским языком. Поисковая система на сервере Excite неплохо работает с повседневными разговорными формами, так что такие запросы, как Where is a good Italian restaurant in New York City? («Где в Нью-Йорке есть хороший итальянский ресторан?») или learn how to speak Chinese («узнать, как научиться говорить по-китайски»), могут оказаться на удивление эффективными.
Поиск источников цитат. Чтобы определить источник коротких цитат, например, «То, что не разрушает меня, делает меня крепче», просто введите нужную цитату в Excite. Не беда, если вы не помните, как оно выглядит в точности: с высокой вероятностью выданные страницы не только подскажут вам, откуда взялось высказывание, но и дадут его точную форму.
Поиск специфической информации. Помимо поиска в Web и Usenet, сервер InfoSeek позволяет искать информацию о компаниях, электронные адреса, а также заглядывать в файлы FAQ (часто задаваемых вопросов). Для этого просто выберите каталог, по которому вы собираетесь вести поиск в разворачивающемся списке на главной поисковой странице.
Не забывайте про заглавные буквы. Разыскивая имена собственные, пишите их в запросе с заглавной буквы - например, Hammer, а не hammer.
Убирайте не относящиеся к делу
слова. Хотя Lycos не поддерживает поиска
с использованием булевых операторов,
для усовершенствования поисковой
процедуры можно
Отличайте слова от фрагментов слов. Независимо от того, является введённая последовательность словом или цепочкой знаков в составе какого-либо другого слова, Lycos трактует её одинаково. Поэтому, если вы просто введёте последовательность graph граф, график, то Lycos будет искать ещё и graphs графы, графики, и graphics проектирование, графика, и graphite графит. Если вы хотите ограничить поиск в Lycos в точности введённым вами словом, поставьте после него точку (.).
Поиск по-русски
В Internet немало интересных русских текстов, так что необходимость поискать информацию на русскоязычных страницах возникает довольно часто. Однако эффективно делать это мешают особенности, во-первых, русского алфавита, а во-вторых, русского словоизменения.
Главная проблема русского алфавита - неединственность: на одних русскоязычных узлах господствует КОИ-8, на других - кодировка Windows. Не так уж мало, особенно за рубежом, и транслитерированных страниц (этот способ представления русских текстов иногда называют Ruglish), часто не продублированных ни одной из собственно русских кодировок. Добавьте к этому ещё и отсутствие единого общепринятого способа транслитерации.
Поэтому, собирая в Сети информацию,
скажем, о Митьках, вы получите один
список узлов, задав поисковому серверу
слово Митьки в кодировке Windows; другой
- если сумеете ввести его в КОИ-8 (как это
сделать, можно узнать, например, в «Совинформбюро»
- http://www.siber.com/sib/
Не следует также забывать, что, в отличие от латиницы, где запросы можно вводить одними строчными буквами, а сервер будет искать также слова с соответствующими заглавными, для русских букв этого, естественно, не происходит. Так что в запросе о текстовом редакторе «Лексикон» лучше написать «ЛЕКСИКОН OR Лексикон».
Другая проблема, как уже говорилось, связана с русской морфологией. Понятно, что, если слово Митьки интересует нас не только в именительном падеже (мы хотели бы получить все страницы, где есть что-нибудь «о Митьках», «про Митьков», «Митьковское» и т. д.), надо усечь образец для поиска до Митьк. Если же нам требуются также страницы, на которых упомянут какой-либо отдельный представитель этой группы («Митёк»), придётся либо усекать этот образец вообще до Мит (и налетать на «Митрополита», «Митчелл» и Бог знает кого ещё), либо давать запрос Митьк OR Митек. Не очень удобно, особенно учитывая необходимость повторить это в разных кодировках; к тому же не всегда легко сообразить, какие варианты основы есть у данного слова.
Чтобы избежать хотя бы некоторых неприятностей, можно отправиться на сервер фирмы CompTek. Эта фирма разработала систему поиска (она называется Яndex – «языковой индекс»), учитывающую особенности русского языка, и в рекламных целях открыла у себя страничку для отправки через эту систему запросов к AltaVista. Слова в запросе, который вы вводите на сервере CompTek, автоматически «размножаются» и передаются на AltaVista уже во всех формах - все, что нужно, и ничего лишнего.
Ещё одно очень полезное свойство сервера - переключение кодировок: чтобы отправить один и тот же запрос в разных кодировках, не нужно вводить его дважды. Раз введённый запрос будет автоматически перекодирован при выборе новой кодировки (вам останется только поменять шрифт для просмотра результата). Кодировок на сервере две - КОИ-8 и Windows. Этого хватает: хотя некоторые узлы имеют страницы в других кодировках, все такие страницы продублированы в кодировке КОИ-8 или Windows (а часто и в обеих).
С транслитерацией Яndex, увы, не работает - слишком много существует разных её форм, иногда непоследовательных (одно и то же слово на одной и той же странице может быть написано по-разному). Поиск на подобных страницах очень труден в любом случае, поэтому будем надеяться, что их авторы рано или поздно (лучше, конечно, раньше, чем позже) перейдут с латиницы на кириллицу. А в кириллице работать с поисковой страницей CompTek - одно удовольствие. Так что наслаждайтесь: http://www.cti.ru/alta.html.
Среди русскоязычных поисковых серверов мы чаще всего используем Rambler http://www.rambler.com.
Internet – это не просто общее хранилище информации. Развитие Internet внесло принципиально новые виды связи и общения между людьми. Электронная почта в настоящее время является самым дешевым способом общения. Благодаря эл. почте стали возможными новые методы работы, когда уже не имеет большого значения территориальное положение сотрудник или компании-партнера. Более того, электронная почта по скорости не уступает телефонному разговору или факсу, а новые дополнительные возможности, которые раскрываются с появлением электронной почты, делает сегодня ее незаменимым инструментом в бизнесе.
Но Internet – это не только электронная почта. В настоящее время на рынке появилось множество компаний, которые обеспечивают отправку и доставку факсов по сети Internet. При этом затраты на отправку факсимильных сообщений сокращаются на порядок.
Следующее применение Internet – это Internet-телефония. Если раньше междугородний, а тем более международный телефонный разговор означал большие денежные траты, то с появлением Internet и соответствующего программного обеспечения ситуация в корне меняется.
Возможность передачи звуковой и видео информации лежит в основе организации аудио и видео конференций, а также новой отрасли – рекламы по Internet, которая очень скоро может стать альтернативой рекламе по радио или телевидению.
Доступность и оперативность Internet открывает новые возможности по организации и проведению дистанционного (интерактивного) обучения. Все больше компаний организуют виртуальные курсы обучения и повышения квалификации по различным специальностям. Например, компания Intel открыла дистанционное обучение и сертификацию по своим технологиям и решениям. Кроме того, появилось множество виртуальных университетов, которые предлагают дистанционное обучение с присвоением диплома – точно так же, как и при очном обучении.
По оценкам различных
Аналитический отдел Yandex опубликовал исследование, посвященное развитию Internet в регионах России. В основу исследования легли данные различных служб самого Yandex, а также информация Фонда «Общественное мнение» (ФОМ), TNS, компании RU-Center и проекта «Чёрный квадрат».
Выяснилось, что услугами Internet в России пользуется 25% населения, то есть 29 миллионов человек, из них более 6 миллионов - в Москве и Санкт-Петербурге.
Проведённое исследование подтвердило лидерство обеих столиц по всем показателям распространения Internet и активности пользователей. В частности, по проникновению Internet Москва обгоняет регионы больше чем в 2,5 раза, Санкт-Петербург - в 1,5 раза. Уровень покупательской онлайн-активности обоих мегаполисов также значительно выше. Московские покупатели в 16 раз активнее региональных, петербуржцы - в 6 раз.
Что касается регионов, то больше всего пользователей Internet после Москвы и Санкт-Петербурга насчитывается в Центральном федеральном округе (ЦФО) - 17% всех российских пользователей. Отстают по этому показателю Урал и Дальний Восток (6% и 5% соответственно). ЦФО также занял за счет Московской области третье место по числу доменов на тысячу пользователей, почти в 2 раза превысив средний показатель.
По уровню проникновения Internet первое место среди всех федеральных округов занимает Северо-западный федеральный округ (без учета Санкт-Петербурга). Проникновение Internet в этом регионе составляет 31%, что на 9% больше, чем в среднем по округам. Вторую строчку по этому показателю занимает Дальневосточный федеральный округ - 28%. Однако на Дальнем Востоке меньше всего электронных СМИ, при этом они являются самыми активными. Среднестатистическое СМИ из этого округа предлагает 14 новостей в день. Это в два раза больше среднего. Около 70% дальневосточного новостного трафика поступает из Владивостока.
По двум важным показателям Internet-активности пользователей (развитие блогосферы и покупательская онлайн-активность) среди федеральных округов лидирует Урал, опережая среднероссийские показатели в два раза.
Кроме разницы между столицами и регионами очень заметна разница между городами и остальной частью России. По данным TNS, Internet используют около 40% жителей городов с населением более 100 тысяч человек. Фактически это означает, что проникновение Internet в маленьких городах и деревнях существенно ниже 20%.
По данным Yandex, число сайтов в Рунете выросло за 2007 год на 66%. Каждый день в зоне .RU регистрируется более 1000 новых доменов, что соответствует росту на 62% в год. Этот рост линейный, а не экспоненциальный. Количество доменов, зарегистрированных в регионах, увеличивается несколько медленнее (за последний год - на 57%).
Повсеместное использование
В первые годы применения вычислительной техники основанные на ЭВМ системы создавались с использованием приёмов управления, ориентированных на разработку аппаратуру ЭВМ. Менеджеры проекта фокусировали свое внимание на аппаратуре, поскольку это была самая дорогая часть системы. Чтобы управлять стоимостью аппаратуры, менеджеры установили формальное управление и технические стандарты. Они требовали основательного анализа и проектирования до того, как что-либо реализовывалось. Они измеряли процесс для определения, где можно было бы сделать улучшения. Они настаивали на управлении качеством и обеспечении качества. Они ввели процедуры для управления изменениями. Проще говоря, они применяли методы и средства управления, которые мы рассматриваем как технологию аппаратуры ЭВМ. К сожалению, программное обеспечение создавалось по «остаточному принципу».
В эти первые годы программирование рассматривалось как одна из «форм искусства». Существовали немногие формальные методы, и очень немногие люди использовали эти методы. Программист часто учился сам методом проб и ошибок. Жаргон и сложность построения программного обеспечения ЭВМ создали таинственность, в которую лишь немногие менеджеры хотели вникать. Мир программного обеспечения был, по существу, недисциплинированным - и многие его участники любили это!
Сегодня распределение стоимости разработки основанных на ЭВМ систем изменилась принципиально. Программное обеспечение, а не аппаратура является самым большим по стоимости компонентом. За почти два десятилетия менеджеры и многие технические разработчики задавали себе следующие вопросы:
Эти и многие другие вопросы являются проявлением интереса к программному обеспечению и способу, которым оно разрабатывается - интересу, который ведёт к принятию практики технологии программирования.
Для того, чтобы начать искать ответы на поставленные вопросы, необходимо понять, что такое программное обеспечение, важно тщательно рассмотреть его характеристики, которые отличают его от других вещей, разрабатываемых человеком. При разработке оборудования ЭВМ, проводимый человеком процесс (анализ, проектирование, конструирование, испытания) в конце концов преобразуется в физическую форму. Если мы создаём новый компьютер, наше первоначальные наброски, формальные схемы проекта и прототип переходят в физический продукт (VLSI-чипы, монтажные платы, источники питания, и т.д.).
Программное обеспечение скорее логический, чем физический элемент системы. Поэтому его определённые характеристики существенно отличны от аналогичных характеристик аппаратуры ЭВМ.
Программное обеспечение разрабатывается или конструируется, но не производится классическом понимании.
Хотя некоторое подобие между разработкой программного обеспечения и производством аппаратуры существует, эти два вида деятельности фундаментально различны. В обоих видах деятельности высокое качество достигается хорошим проектированием, но фаза производства для аппаратуры может внести проблемы, связанные с качеством, которых нет (или почти нет) для программного обеспечения. Оба вида деятельности зависят от людей, но связь между людьми и осуществляемой работой полностью различна. Оба вида деятельности требуют конструирования «продукта», но при этом подходы абсолютно различны.