DTD - модуль 构建 XML

Основные строительные блоки XML и HTML документов - это такие теги, как <body>...</body>.

Строительные блоки XML документов

Все XML документы (и HTML документы) состоят из следующих простых строительных блоков:

  • Элементы
  • Атрибуты
  • Сущности
  • PCDATA
  • CDATA

Ниже приведено краткое описание каждого строительного блока.

Элементы

Элементы являются основными строительными блоками XML и HTML документовОсновные строительные блоки.

Примеры элементов HTML - это "body" и "table". Примеры элементов XML - это "note" и "message". Элементы могут содержать текст, другие элементы или быть пустыми. Примеры пустых элементов HTML - это "hr", "br" и "img".

Пример:

<body>текст между</body>
<message>некоторое сообщение между</message>

Атрибуты

Атрибуты могут предоставлятьДополнительная информация о элементе.

Атрибуты всегда置于 начале тега элемента. Атрибуты всегда начинаются сИмя/Значениеявляется парным.


Имя элемента - "img". Имя атрибута - "src". Значение атрибута - "computer.gif". Поскольку элемент пуст, он закрывается слешем '/',

Сущности

Сущности используются для определения переменных обычного текста. Ссылка на сущность - это ссылка на сущность.

Большинство студентов знакомы с этой ссылкой на HTML сущность: " ". Эта сущность 'пробел без перевода строки' используется в HTML для вставки дополнительного пробела в документ.

Когда документ обрабатывается анализатором XML, сущности разворачиваются.

Следующие сущности предопределены в XML:

Ссылка на сущность Символы
< <
> >
& &
" "
' '

PCDATA

PCDATA означает обработанные данные символов (parsed character data).

Данные символов можно представить как текст между началом и концом тега XML.

PCDATA - это текст, который будет обработан анализатором. Этот текст будет проверен анализатором на сущности и теги.

Теги в тексте обрабатываются как метки, а сущности разворачиваются.

Однако, интерпретируемые данные символов не должны содержать任何 символов &、< или >; их нужно заменить соответствующими сущностями &、< и >.

CDATA

CDATA означает данные символов (character data).

CDATA - это текст, который не будет интерпретирован анализатором.Теги в этих текстах не будут рассматриваться как маркеры, а сущности не будут разворачиваться.