Расширенный язык разметки документов XML

Автор работы: Пользователь скрыл имя, 17 Октября 2012 в 01:14, курсовая работа

Описание работы

Развитие HTML в определенном смысле зашло в тупик - новые теги уже не нужны, поскольку хватает существующих, к тому же акцент разработки веб-страниц сместился на стили, которые расширяют возможности по оформлению документов. Естественно, CSS никак не подменяет HTML, но зато позволяет использовать ограниченный набор тегов, а вид элементов, их положение и различные параметры задавать через стили.

Содержание работы

ВВЕДЕНИЕ 3
ГЛАВА1. СУЩНОСТЬ XML 5
ГЛАВА2. ВАЛИДАЦИЯ XHTML ДОКУМЕНТОВ…………………..…....….9
2.1 Строго конформные документы…………………………………....…..12
2.2 Использование XML с другими пространствами имен…….……....…13
2.3 Конформность пользовательских агентов…………………..……..…..14
ГЛАВА3. БУДУЩЕЕ HTML ……………...……………………..…………….21
ЗАКЛЮЧЕНИЕ………………………………………………………...….…….31
СПИСОК ЛИТЕРАТУРЫ…………..…………………………………………...32

Файлы: 1 файл

инфор.12.doc

— 134.50 Кб (Скачать файл)

 

Содержание

ГЛАВА3. БУДУЩЕЕ HTML ……………...……………………..…………….21

ЗАКЛЮЧЕНИЕ………………………………………………………...….…….31

СПИСОК ЛИТЕРАТУРЫ…………..…………………………………………...32

 

ВВЕДЕНИЕ

Развитие HTML в  определенном смысле зашло в тупик - новые теги уже не нужны, поскольку  хватает существующих, к тому же акцент разработки веб-страниц сместился  на стили, которые расширяют возможности по оформлению документов. Естественно, CSS никак не подменяет HTML, но зато позволяет использовать ограниченный набор тегов, а вид элементов, их положение и различные параметры задавать через стили.

Определенным  ограничением HTML является и то, что  он относится к формальным языкам, в том смысле, что теги и их иерархическая структура жестко описаны в спецификации. Поэтому популярность набирает XML, с помощью которого можно создавать собственные теги и формировать их структуру. Разница между HTML и XML состоит не только в тегах, но и правилах написания кода. Браузер при работе с HTML "закрывает глаза" на разные мелкие огрехи и недочеты в структуре или тому, что не корректно указан параметр. С XML такие фокусы не проходят, поэтому браузер выдаст ошибку о том, что документ неверно сформирован.

Чтобы научить разработчиков "правильному" мышлению, изменить их стиль написания кода, а также сократить разрыв между HTML и XML, и был разработан XHTML, как промежуточный этап между ними.

XML (EXtensible HyperText Markup Language, Расширенный язык разметки гипертекста) предназначен для замены HTML и считается его более строгой версией. Вообще,W3C определяет XML как последнюю версию HTML, которая постепенно его вытеснит. Так ли это будет обстоять на самом деле, покажет только время.

Если рассуждать о некотором идеальном коде веб-страницы, то его можно сравнить с программой, которая не будет скомпилирована до тех пор, пока все ошибки не исправлены. Браузер выступает в роли компилятора  и не отображает документ, если он не соответствует спецификации. XML, сохраняя все особенности HTML, вносит более строгие правила создания страниц, чтобы приблизиться к "идеальному" коду. Это позволяет делать сайты независимыми от устройства отображения и браузера. Иными словами, сайт будет корректно показываться во всех современных браузерах и платформах вроде компьютеров, смартфонов, наладониках и т.д.

На деле все  обстоит не так прозаично. Разработчики браузеров не могут позволить  себе, чтобы их детище работало только с "правильным" кодом. А все  из-за того, что большая часть сайтов в мире просто не будет отображаться в таком браузере. Виноваты в таком положении вещей и разработчики и пользователи. Первые не обеспечили должную поддержку спецификации в своих браузерах, а вторые не потрудились ей следовать.

По этим причинам XML является всего лишь подобием HTML, но с более строгим синтаксисом, а не тем перспективным языком разметки, на который обязательно стоит переходить из-за его уникальных возможностей. Об этом языке и пойдет речь в данной курсовой работе.

Целью данной работы является рассмотрение расширенного языка XML.

Задачи:

-рассмотреть  сущность XML

-рассмотреть конформность пользовательских агентов

-рассмотреть  валидацию XHTML документов

-рассмотреть будущее HTML.

 

ГЛАВА1. СУЩНОСТЬ XML.

XML (англ. Extensible Hypertext Markup Language - Расширяемый язык разметки гипертекста) - язык разметки веб-страниц, по возможностям сопоставимый с HTML, однако является подмножеством XML. Как и HTML, XHTML соответствует спецификации SGML. Вариант XHTML 1.1 одобрен в качестве Рекомендации Консорциума Всемирной паутины (W3C) 31 мая 2001 года.

XHTML представляет  собой семейство имеющихся на  данный момент и могущих появиться  в будущем типов документов  и модулей, являющихся копиями,  подмножествами или расширениями языка HTML 4. Семейство типов документов XHTML базируется на XML и предназначено для работы с пользовательскими агентами на базе. Более подробную информацию об этом семействе и его эволюции можно найти в разделе "Направления развития".

XHTML 1.0 (настоящая спецификация) представляет первый тип документов семейства XHTML. В ней три типа документов HTML 4 переформулируются в терминах XML 1.0. Она предназначена для использования в качестве языка содержимого, как соответствующего XML, так и, если соблюдены некоторые простые требования, работающего в конформных пользовательских агентах HTML 4. Разработчики, переносящие свои документы в XHTML 1.0, получат следующие преимущества:

Документы XHTML соответствуют XML. Как таковые они без труда  просматриваются, редактируются и проверяются на корректность стандартными средствами XML.

Документы XHTML могут  работать лучше, чем они работали в существующих пользовательских агентах, соответствующих HTML 4, а также в  новых пользовательских агентах, соответствующих XHTML 1.0.

Документы XHTML могут использовать прикладные программы (например, скрипты и апплеты), базирующиеся на HTML Document Object Model или XML Document Object Model [DOM] .

По мере расширения семейства XHTML документы, соответствующие XHTML 1.0, будут с большей вероятностью совместимы с различными средами XHTML.

Семейство XHTML является следующим шагом в эволюции Интернет. Переходя сегодня на XHTML, разработчики содержимого (контента) могут вступить в мир XML со всеми его преимуществами, сохраняя при этом совместимость содержимого с более старыми и более новыми версиями.

Преимущества XHTML.

Для XHTML можно  применять множество технологий разработанных для XML. Например, XSLT и XPath.

Анализ XHTML проще  и быстрее, чем HTML. Поскольку синтаксис XML строже, чем SGML, обработка XHTML возможна даже на мобильных телефонах с малыми ресурсами.

Различия между XHTML и HTML.

Все элементы должны быть закрыты. Теги, которые не имеют  закрывающего тега (например, <img> или <br>) должны иметь на конце / (например, <br />).

Булевы атрибуты записываются в развёрнутой форме. Например, следует писать <option selected="selected"> или <td nowrap="nowrap">.

Все значения атрибутов  обязательно должны быть заключены  в двойные, либо одинарные кавычки.

Имена тегов  и атрибутов должны быть записаны строчными буквами (например, <img alt="" /> вместо <IMG ALT="" />).

XHTML гораздо  строже относится к ошибкам  в коде; < и & везде, даже  в URL, должны замещаться < и & соответственно. По рекомендации >W3C браузеры, встретив ошибку в XHTML, должны сообщить о ней и не обрабатывать документ для HTML браузеры должны были попытаться понять, что хотел сказать автор.

Кодировкой  по умолчанию является UTF-8 (в отличие  от HTML, где кодировкой по умолчанию  является ISO 8859-1).

Отличия переходного (англ. transitional) XHTML от HTML незначительны и предназначены лишь для приведения его в соответствие с XML. Остальные версии отличаются лишь набором тегов.

В том случае, если MIME-тип - text/html (а это чаще всего  и есть значение по умолчанию), все  современные браузеры поддерживают XHTML. Он также совместим и со старыми браузерами, т.к в основе XHTML лежит HTML.

Однако если автор страницы задал MIME-тип как application/xhtml+xml, браузер Internet Explorer 6 не сможет обрабатывать страницу, поскольку у  него нет XML-парсера. Это одна из причин, замедляющих процесс перехода от HTML к XHTML.

Впрочем, проблема с MIME-типом легко решается при  помощи простого PHP-скрипта, меняющего  пресловутый MIME-тип в зависимости  от пользовательского агента.

Версии XHTML.

XHTML 1.0 Переходный (Transitional): предназначен для лёгкой миграции из HTML 3.2 и для тех, кто использует инлайн-фрэймы.

XHTML 1.0 Строгий  (Strict): полностью отделяет содержание  документа от оформления (которое  теперь задаётся только через  CSS), многие атрибуты (такие как,  например, bgcolor и align) более не поддерживаются, их поведение можно задавать только через таблицу стилей.

XHTML 1.0 Фрэймовый  (Frameset): используется, если необходимо  разделить окно браузера на  несколько фрэймов.

XHTML 1.1 Модульный  (Module-based): авторы могут импортировать дополнительные свойства в их разметку.

XHTML Основной (Basic): специальная облегчённая версия XHTML для устройств, которые не  могут использовать полный набор  элементов XHTML - в основном используется  в миниатюрных устройствах, таких как мобильные телефоны. Подразумевается, что он заменит WML и C-HTML.

XHTML мобильного  профиля (Mobile Profile): основанный на XHTML Basic, добавляет специфические  элементы для мобильных телефонов.

XHTML 2.0. Пока в  разработке. Синтаксис еще больше  приближен к синтаксису XML. Также является модульным языком.

 

Глава2. Валидация XML документов

Баннер, которым W3C предлагает помечать валидные XML сайты.

Валидным (т.е. отвечающим всем правилам) XML-документом считается  документ, удовлетворяющий технической  спецификации. В идеале, все браузеры должны следовать веб-стандартам и, в соответствии с ними, валидные документы должны отображаться во всех браузерах на всех платформах. Валидация XML-документа рекомендована даже несмотря на то, что она не гарантирует кросс-браузерности. Документ может быть проверен на соответствие спецификации с помощью онлайновой Службы валидации разметки W3C. Валидация обнаружит и разъяснит ошибки в XML-разметке.

Валидный документ должен содержать определение типа документа (DTD). DTD должен быть расположен до всех других элементов документа. Вот наиболее распространённые типы DTD для XML:

XML 1.0 Strict

<! DOCTYPE html PUBLIC "- // W3C // DTD XHTML 1.0 Strict // EN" "http://www.w3.org/TR/xml1/DTD/xml1-strict. dtd">

XML 1.0 Transitional

<! DOCTYPE html PUBLIC "- // W3C // DTD XHTML 1.0 Transitional // EN" "http://www.w3.org/TR/xml1/DTD/xml1-transitional. dtd">

XML 1.0 Frameset

<! DOCTYPE html PUBLIC "- // W3C // DTD XML 1.0 Frameset // EN" "http://www.w3.org/TR/xml1/DTD/xml1-frameset. dtd">

XML 1.1

<! DOCTYPE html PUBLIC "- // W3C // DTD XML 1.1 // EN" "http://www.w3.org/TR/xml11/DTD/xml11. dtd">

Самыми распространёнными  ошибками в XML-разметке являются:

Незакрытые элементы (XML, в отличие от HTML, требует закрытия всех элементов, в том числе не имеющих закрывающего тега, как, например, <br />).

Отсутствие альтернативных текстов для изображений (достигающийся применением атрибута alt, который помогает сделать документы доступнее для устройств, которые не в состоянии отображать изображения, или предназначенных для слабовидящих людей).

Присутствие текста непосредственно  в теге <body> документа (должен быть объявлен блочный элемент, внутрь которого следует помещать содержимое).

Вложение блочных элементов  внутрь инлайновых (внутристрочных) (например, блочные элементы <div> или <p> не могут быть вложены внутрь инлайновых элементов <a>, <span>, <em> и так  далее).

Пренебрежение заключением  значений атрибутов в кавычки (<a href=http://www.ru/> вместо <a href="http://www.ru/">).

Неправильное вложение элементов (конструкции вида <strong> <em> </strong> </em>).

Неправильное использование  ссылок-мнемоник (например & вместо &)

Написание тегов и/или  атрибутов прописными буквами (<DIV STYLE="…"> вместо <div>).

Задание в теге <! DOCTYPE …> относительного пути к DTD-файлу, скопированное с сайта www.w3.org ("DTD/xml11. dtd" вместо "http://www.w3.org/TR/xml11/DTD/xml11. dtd").

Преимущества  перехода на XHTML 1.0 описаны выше. Вот  несколько основных преимуществ:

Разработчики  документов и создатели пользовательских агентов постоянно открывают  новые способы выражения своих  идей в новой разметке. В XML ввод новых  элементов или атрибутов достаточно прост. Семейство XHTML разработано так, чтобы принимать расширения путем модулей и технологий XHTML для разработки новых соответствующих XHTML модулей (описанных в готовящейся спецификации Модуляризации XHTML). Модули позволят комбинировать существующие и новые наборы функций при разработке содержимого и создании новых пользовательских агентов.

Постоянно вводятся альтернативные методы доступа в  Интернет. По некоторым оценкам, в 2010 году 95% обращений к документам в  Интернет будет выполняться с альтернативных платформ. Семейство XHTML создавалось с учетом общей совместимости пользовательских агентов. С помощью нового механизма профилирования пользовательских агентов и документов серверы, прокси и пользовательские агенты смогут преобразовывать содержимое наилучшим образом. В конечном счете, станет возможной разработка соответствующего XHTML содержимого, пригодного для любого соответствующего XHTML пользовательского агента.

 

2.1 Строго конформные  документы

 

Строго конформный документ XHTML - это документ, которому необходимы только возможности, описанные в настоящей спецификации как обязательные. Такой документ должен соответствовать всем следующим критериям:

Он должен проходить  проверку корректности в соответствии с одним из трех DTD, приведенных в приложении A.

Корневым элементом  документа должен быть элемент <html>.

Корневой элемент документа  должен назначать пространство имен XHTML с использованием атрибута xmlns. Пространство имен для XHTML определено в http://www.w3.org/1999/xhtml.

В документе до корневого элемента должно иметься объявление DOCTYPE. Открытый идентификатор, включаемый в объявление DOCTYPE, должен ссылаться на одно из трех DTD, приведенных в приложении A, с помощью соответствующего формального открытого идентификатора. Системный идентификатор может изменяться, отражая соглашения, принятые в локальной системе.

Информация о работе Расширенный язык разметки документов XML