Расширяемый язык разметки XML

Автор работы: Пользователь скрыл имя, 14 Октября 2013 в 23:51, курсовая работа

Описание работы

В 1996 году консорциумом Word Wide Web, была предпринята попытка, приступить к проектированию расширяемого языка разметки, который сочетал бы в себе гибкость и мощность языка SGML и совместимый с распространенностью HTML. Этот язык получил название (Extensible Markup Language) XML. А в феврале 1998 был принят стандарт этого языка как XML 1.0 в качестве рекомендаций W3C. В настоящий момент существует выпущенная 6 октября 2000 года Extensible Markup Language (XML) 1.0 (Second Edition) рекомендация консорциума W3C.

Содержание работы

Введение……………………………………………………………………стр.2
1.Расширяемый язык разметки XML……………………………………стр.3
1.1. Достоинства…………………………………………………………...стр.3
1.2. Недостатки………………………………………………………….....стр.5
1.3. Отображение XML во Всемирной паутине………………………...стр.6
1.4. Словари XML………………………………………………………....стр.7
2. Структура XML-документа……………………………………………стр.7
2.1. Конструкции языка…………………………………………………...стр.9
2.2. Моделирование XML-документов…………………………………стр.11
3. Схемы данных…………………………………………………………стр.19
Заключение………………………………………………………………стр.27
Список использованной литературы……………………………………

Файлы: 1 файл

курсовая по языку XML.docx

— 172.10 Кб (Скачать файл)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РФ

Государственный Университет Управления

Российско - Голландский факультет  маркетинга

 

 

                                      Курсовая работа

 

по дисциплине «Компьютерная подготовка»

 

на тему:

 

«Расширяемый язык разметки XML»

 

 

 

 

                                                                Выполнил: студент 1 курса

                                                                               РГФМ

                                                                            Федоров  П.Д.

                                                                Преподаватель: Лобанова А.М

       Содержание

Введение……………………………………………………………………стр.2 

1.Расширяемый язык разметки  XML……………………………………стр.3

1.1. Достоинства…………………………………………………………...стр.3

1.2. Недостатки………………………………………………………….....стр.5

1.3. Отображение XML во Всемирной паутине………………………...стр.6

1.4. Словари XML………………………………………………………....стр.7

2. Структура XML-документа……………………………………………стр.7

2.1. Конструкции языка…………………………………………………...стр.9

2.2. Моделирование XML-документов…………………………………стр.11

3. Схемы данных…………………………………………………………стр.19

Заключение………………………………………………………………стр.27

Список использованной литературы……………………………………стр.28

 

 

 

 

 

 

 

 

 

Введение

В 1996 году консорциумом Word Wide Web, была предпринята попытка, приступить к проектированию расширяемого языка разметки, который сочетал бы в себе гибкость и мощность языка SGML и совместимый с распространенностью HTML. Этот язык получил название (Extensible Markup Language) XML. А в феврале 1998 был принят стандарт этого языка как XML 1.0 в качестве рекомендаций W3C. В настоящий момент существует выпущенная 6 октября 2000 года Extensible Markup Language (XML) 1.0 (Second Edition) рекомендация консорциума W3C. См. также:

В настоящий момент фирма  Microsoft® начинает широко применять язык XML при работе со структурированными данными в своих продуктах.

Ниже коротко рассматривается  определения и синтаксические конструкции  этого языка. Это оказалось трудным  расположить так информацию, чтобы  в порядке прямого её чтения не встречалось ни одного термина, который  был бы не разъяснённым предварительно. Поэтому, если при чтении у вас  возникнут подобные затруднения, не смущайтесь, читайте дальше. Просто при разборе соответствующей  синтаксической конструкции или  понятия вернитесь назад, чтобы  уточнить соответствующее понятие.

Символы. 

К числу символов, допустимых в XML-документах относятся все три  управляющих C0 символа стандарта ANSII, все обычные символы этого  стандарта, и почти все символы  Unicode:

Значение (в hex)

Описание

   

09

Горизонтальная табуляция (HT)

0A

Перевод строки (LF)

0D

Возврат каретки (CR)

20..7E

Символы ANSII

80..D7FF

Символы Unicode (включая Latin-1)

E000..F8FF

"Область частного использования"

F9..FFFD

Идеограммы совместимости  с CJK (китайским-корейским-японским языками)

10000..10FFFF

Суррогатные эквиваленты  и "область исключительного частного использования"


. Несмотря на то, что XML очень молод и отдельные компоненты этого языка находятся еще в стадии доработки, уже сегодня появляются новые языки, созданные на основе XML, возникают многочисленные Web-сервера, использующие эту технологию для организации хранящейся на них информации.

XML (англ. eXtensible Markup Language — расширяемый язык разметки) — рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. Язык разметки документов - это набор специальных инструкций, называемых тэгами, предназначенных для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры. Тэги языка, или, как их иногда называют, управляющие дескрипторы, в таких документах выделяются относительно основного содержимого документа и служат в качестве инструкций для программы, производящей показ содержимого документа на стороне клиента. В самых первых системах для обозначения этих команд использовались символы “<” и “>”, внутри которых помещались названия инструкций и их параметры. Сейчас такой способ обозначения тэгов является стандартным.

XML — текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML). XML является упрощённым подмножеством языка SGML. Создание SGML можно с уверенностью назвать попыткой объять необъятное, так как он объединяет в себе такие возможности, которые крайне редко используются все вместе. В этом и состоит его главный недостаток — сложность и, как следствие, дороговизна этого языка ограничивает его использование только крупными компаниями, которые могут позволить себе купить соответствующее программное обеспечение и нанять высокооплачиваемых специалистов. Наиболее широко SGML применяется для создания других языков разметки, именно с его помощью был создан язык разметки гипертекстовых документов — HTML, спецификация которого была утверждена в 1992 году. Его появление было связано с необходимостью организации стремительно увеличивающегося массива документов в сети Интернет.

Появление HTML — очень простого языка разметки — быстро решило эту проблему: лёгкость в изучении и богатство средств оформления документов сделали его самым  популярным языком для пользователей  Интернет. Но, по мере роста количества и изменения качества документов в Сети, росли и предъявляемые  к ним требования, и простота HTML превратилась в его главный недостаток. Ограниченность количества тегов и  полное безразличие к структуре  документа побудили разработчиков  в лице консорциума W3C к созданию такого языка разметки, который был  бы не столь сложен, как SGML, и не настолько  примитивен, как HTML. В результате на свет появился язык XML, сочетающий в  себе простоту HTML, логику разметки SGML и  удовлетворяющий требованиям Интернета.

    1. Расширяемый язык разметки  XML

XML (Extensible Markup Language) - это язык разметки, описывающий целый класс объектов данных, называемых XML-документами. Этот язык используется в качестве средства для описания грамматики других языков и контроля над правильностью составления документов. Т.е. сам по себе XML не содержит никаких тэгов, предназначенных для разметки, он просто определяет порядок их создания. Таким образом, если, например, мы считаем, что для обозначения элемента rose в документе необходимо использовать тэг ; то XML позволяет свободно использовать определяемый нами тэг и мы можем включать в документ фрагменты, подобные следующему: rose

Набор тэгов может быть легко  расширен. Если, предположим, мы хотим  также указать, что описание цветка должно по смыслу идти внутри описания оранжереи, в которой он цветет, то просто задаем новые тэги и выбираем порядок их следования: rose

      1. Достоинства

Процесс создания XML документа очень прост и  требует лишь базовых знаний HTML и  понимания тех задач, которые  необходимо выполнить, используя XML в  качестве языка разметки. Таким образом, у разработчиков появляется уникальная возможность определять собственные  команды, позволяющие им наиболее эффективно определять данные, содержащиеся в  документе. Автор документа создает  его структуру, строит необходимые  связи между элементами, используя  те команды, которые удовлетворяют  его требованиям, и добивается такого типа разметки, которое необходимо ему для выполнения операций просмотра, поиска, анализа документа.

Еще одним  из очевидных достоинств XML является возможность использования его  в качестве универсального языка  запросов к хранилищам информации. Сегодня в W3C находится на рассмотрении рабочий вариант стандарта XML-QL(или XQL), который, возможно, в будущем  составит серьезную конкуренцию SQL. Кроме того, XML-документы могут  выступать в качестве уникального  способа хранения данных, который  включает в себя одновременно средства для разбора информации и представления  ее на стороне клиента. В этой области  одним из перспективных направлений  является интеграция Java и XML - технологий, позволяющая использовать мощь обеих технологий при построении машинно-независимых приложений, использующих, кроме того, универсальный формат данных при обмене информации.

XML позволяет  также осуществлять контроль  над корректностью данных, хранящихся  в документах, производить проверки  иерархических соотношений внутри  документа и устанавливать единый  стандарт на структуру документов, содержимым которых могут быть  самые различные данные. Это означает, что его можно использовать  при построении сложных информационных  систем, в которых очень важным  является вопрос обмена информацией  между различными приложениями, работающими в одной системе.  Создавая структуру механизма  обмена информации в самом  начале работы над проектом, менеджер  может избавить себя в будущем  от многих проблем, связанных  с несовместимостью используемых  различными компонентами системы  форматов данных.

Также одним  из достоинств XML является то, что программы-обработчики XML-документов не сложны и уже сегодня  появились и свободно распространяются всевозможные программные продукты, предназначенные для работы с XML-документами. XML поддерживается в IE5. Было заявлено о  его поддержке в последующих  версиях Netscape Communicator, СУБД Oracle, DB-2, в приложениях MS-Office. Все это дает основания предполагать, что, скорее всего, в ближайшем будущем XML станет основным языком обмена информации для информационных систем, заменив собой, тем самым, HTML. На основе XML уже сегодня созданы такие известные специализированные языки разметки, как SMIL, CDF, MathML, XSL, и список рабочих проектов новых языков, находящихся на рассмотрении W3C, постоянно пополняется.

 

 

 

 

    1. Недостатки 
  • Синтаксис XML избыточен.
  • Размер XML-документа существенно больше бинарного представления тех же данных. В грубых оценках величину этого фактора принимают за 1 порядок (в 10 раз).
  • Размер XML-документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON, YAML, Protocol Buffers) и особенно в форматах данных, оптимизированных для конкретного случая использования.
  • Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
  • XML содержит метаданные (об именах полей, классов, вложенности структур), и одновременно XML позиционируется как язык взаимодействия открытых систем. При передаче между системами большого количества объектов одного типа (одной структуры), передавать метаданные повторно нет смысла, хотя они содержатся в каждом экземпляре XML описания.
  • Для большого количества задач не нужна вся мощь синтаксиса XML и можно использовать значительно более простые и производительные решения.

Неоднозначность моделирования.

  • Нет общепринятой методологии для моделирования данных в XML, в то время как для реляционной модели и объектно-ориентированной такие средства разработаны и базируются на реляционной алгебре, системном подходе и системном анализе.
  • В природе есть множество объектов и явлений, для описания которых разные структуры данных (сетевая, реляционная, иерархическая) являются естественными, и отображение объекта в неестественную для него модель является болезненным для его сути. В случае с реляционной и иерархической моделями определены процедуры декомпозиции, обеспечивающие относительную однозначность, чего нельзя сказать о сетевой модели.
  • В результате большой гибкости языка и отсутствия строгих ограничений, одна и та же структура может быть представлена множеством способов (различными разработчиками), например, значение может быть записано как атрибут тега или как тело тега и т. д. Например: <a b="1" c="1"/> или <a b="1" c="1"></a> или <a><b>1</b><c>1</c></a> или <a><c value="1"/></a> или <a><fields b="1" c="1"/></a> и т. д.
  • Поддержка многих языков в именовании тегов дает возможность назвать, например вес русским словом, в таком случае компьютер никак не сможет установить соответствия этого поля с полем weight в англоязычной версии программы и с полями в версиях модели объекта на множестве других языков.
  • XML не содержит встроенной в язык поддержки типов данных. В нём нет строгой типизации, то есть понятий «целых чисел», «строк», «дат», «булевых значений» и т. д.
  • Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами и сетевой моделью данных.
  • Выражение неиерархических данных (например графов) требует дополнительных усилий.
  • Пространства имён XML сложно использовать и их сложно реализовывать в XML-парсерах.
  • Существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком (YAML, JSON, SweetXML, XF).
      1. Отображение XML во Всемирной паутине

Наиболее распространены три способа преобразования XML-документа  в отображаемый пользователю вид:

Применение стилей CSS;

Применение XSL;

Написание на каком-либо языке программирования обработчика XML-документа.

Без использования CSS или XSL XML-документ отображается как простой текст в большинстве веб-браузеров. Некоторые браузеры, такие как Internet Explorer и Mozilla Firefox отображают структуру документа в виде дерева, позволяя сворачивать и разворачивать узлы с помощью нажатий клавиши мыши.

Информация о работе Расширяемый язык разметки XML