DTD - XML-Baukasten

XML 以及 HTML 文档的主要构建模块是类似于 <body>....</body> 这样的标签。

XML 文档构建模块

所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

  • 元素
  • 属性
  • Entity
  • PCDATA
  • CDATA

以下是每个构建模块的简要描述。

元素

元素是 XML 以及 HTML 文档的主要构建模块

HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message"。元素可以包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

实例:

<body>body text in between</body>
<message>some message in between</message>

属性

属性可以提供有关元素的额外信息

属性总是位于某个元素的开始标签中。属性总是以名称/值出现的对形式。下面的 "img" 元素包含有关源文件的额外信息:

<img src="computer.gif" />

Der Name des Elements ist "img". Der Name des Attributes ist "src". Der Wert des Attributes ist "computer.gif". Da das Element selbst leer ist, wird es mit einem "/" geschlossen.

Entity

Entities sind Variablen zur Definition von regulärem Text. Entity-Referenzen sind die Referenz auf die Entities.

Die meisten Schüler kennen diesen HTML-Entity-Referenz: " ". Diese "keine Umbruchspalte"-Entity wird in HTML verwendet, um einen zusätzlichen Leerzeichen in einem Dokument einzufügen.

Wenn das Dokument von einem XML-Parser verarbeitet wird, werden die Entities erweitert.

Die folgenden Entities sind in XML voraufge definiert:

Entity-Referenz Zeichen
< <
> >
& &
" "
' '

PCDATA

PCDATA bedeutet verarbeitete Zeichen-Daten (parsed character data).

Man kann Zeichen-Daten als den Text zwischen dem Start- und End-Tag eines XML-Elements betrachten.

PCDATA wird vom Parser verarbeitet. Diese Texte werden vom Parser auf Entities und Markierungen überprüft.

Die Tags im Text werden als Markierungen behandelt, und die Entity wird erweitert.

Allerdings sollten die verarbeiteten Zeichen-Daten keine &-, <- oder >-Zeichen enthalten; sie müssen durch die Entities &, < und > ersetzt werden.

CDATA

CDATA bedeutet Zeichen-Daten (character data).

CDATA wird nicht vom Parser verarbeitet.Die in diesen Texten enthaltenen Tags werden nicht als Markierungen behandelt, und die Entity wird nicht erweitert.