DTD - XML byggmodul

XML 以及 HTML 文档的主要构建模块是类似 <body>....</body> 这样的标签。

XML 文档构建模块

所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

  • 元素
  • 属性
  • Entity
  • PCDATA
  • CDATA

下面是每个构建模块的简要描述。

元素

元素是 XML 以及 HTML 文档的主要构建模块

HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

实例:

<body>body text in between</body>
<message>some message in between</message>

属性

属性可提供有关元素的额外信息

属性总是被置于某元素的开始标签中。属性总是以名称/值的形式成对出现的。下面的 "img" 元素拥有关于源文件的额外信息:

<img src="computer.gif" />

Elementets namn är "img". Egenskapens namn är "src". Egenskapens värde är "computer.gif". Eftersom elementet är tomt stängs det med en "/".

Entity

Entityer används för att definiera variabler för vanlig text. Entityreferenser är referenser till entityer.

De flesta elever känner till denna HTML entityreferens: " ". Denna "icke-break space" entity används i HTML för att lägga till en extra blanksteg i ett dokument.

När dokumentet analyseras av XML-tolkaren utökas entityerna.

Följande entityer är fördefinierade i XML:

Entityreferens Tecken
< <
> >
& &
" "
' '

PCDATA

PCDATA betyder analyserade tecken data (parsed character data).

Man kan tänka sig tecken data som texten mellan XML-elementets öppnings- och avslutningsmärken.

PCDATA är text som analyseras av tolkaren. Denna text kommer att kontrolleras av tolkaren för entityer och märken.

Märkena i texten behandlas som märken, och de entityer som finns där utökas.

Men de analyserade tecken datan bör inte innehålla några &、< eller > tecken; använd &、< och > entityer för att ersätta dem respektive.

CDATA

CDATA betyder tecken data (character data).

CDATA är text som inte analyseras av tolkaren.Märkena i dessa texter behandlas inte som märken, och de entityer som finns där utökas inte.