DTD - модуль 构建 XML

Основные строительные блоки XML и HTML-документов — это такие теги, как <body>...</body>.

Строительные блоки XML-документов

Все XML-документы (и HTML-документы) состоят из следующих простых строительных блоков:

  • Элемент
  • Атрибуты
  • Сущности
  • PCDATA
  • CDATA

Ниже приведено краткое описание каждого строительного блока.

Элемент

Элементы являются основными строительными блоками как XML, так и HTML документовОсновные строительные блоки.

Примерами элементов HTML являются "body" и "table". Примерами элементов XML являются "note" и "message". Элементы могут содержать текст, другие элементы или быть пустыми. Примерами пустых элементов HTML являются "hr", "br" и "img".

Пример:

<body>текст между ними</body>
<message>сообщение между ними</message>

Атрибуты

Атрибуты могут предоставлятьДополнительная информация о элементе.

Атрибуты всегда置于元素的开始标签中. Атрибуты всегда начинаются сИмя/значениеПара出现的。Ниже приведены дополнительные данные о файле для элемента "img":

<img src="computer.gif" />

Имя элемента - "img". Имя атрибута - "src". Значение атрибута - "computer.gif". Поскольку элемент сам по себе пуст, он закрывается символом "/".

Сущности

Сущности используются для определения переменных обычного текста. Ссылка на сущность - это ссылка на сущность.

Большинство студентов знакомы с этой HTML сущностью: " ". Эта сущность "пробел без перевода строки" используется в HTML для вставки дополнительного пробела в документ.

Когда документ анализируется XML анализатором, сущности будут расширены.

Следующие сущности предварительно определены в XML:

Ссылка на сущность Символ
< <
> >
& &
" "
' '

PCDATA

PCDATA означает анализируемые данные символов (parsed character data).

Символьные данные можно представить собой текст между началом и концом тега XML.

PCDATA - это текст, который будет анализироваться анализатором. Эти тексты будут проверены анализатором на наличие сущностей и маркеров.

Теги в тексте будут рассматриваться как маркеры, а сущности будут расширены.

Однако анализируемые данные символов не должны содержать никаких символов &、< или >; для их замены следует использовать эквиваленты &、< и >.

CDATA

CDATA означает данные символов (character data).

CDATA - это текст, который не будет анализироваться анализатором.Теги в этих текстах не будут рассматриваться как маркеры, а сущности не будут расширены.