DTD - XML Building Module

De hoofdconstructie-eenheden van XML- en HTML-documenten zijn tags zoals <body>...</body>.

XML-documentconstructie-eenheden

Alle XML-documenten (en HTML-documenten) bestaan uit de volgende eenvoudige constructie-eenheden:

  • Elementen
  • Eigenschappen
  • Entiteit
  • PCDATA
  • CDATA

Hier is een korte beschrijving van elke constructie-eenheid.

Elementen

Elementen zijn de hoofdconstructie-eenheid van XML- en HTML-documentenHoofdconstructie-eenheid.

Voorbeelden van HTML-elementen zijn "body" en "table". Voorbeelden van XML-elementen zijn "note" en "message". Elementen kunnen tekst, andere elementen of leeg zijn. Voorbeelden van lege HTML-elementen zijn "hr", "br" en "img".

Voorbeeld:

<body>tekst in het midden</body>
<message>een bericht in het midden</message>

Eigenschappen

Eigenschappen kunnenExtra informatie over het element.

Eigenschappen worden altijd geplaatst in de begin标签 van een element. Eigenschappen beginnen altijd metNaam/waardevan de vorm die parenlijk voorkomt. De volgende "img"-element heeft extra informatie over de bronbestand:

<img src="computer.gif" />

De naam van het element is "img". De naam van het attribuut is "src". De waarde van het attribuut is "computer.gif". Omdat het element zelf leeg is, wordt het afgesloten met een "/".

Entiteit

Entiteiten worden gebruikt om variabelen voor gewone tekst te definiëren. Entiteitreferenties zijn verwijzingen naar entiteiten.

De meeste studenten zijn bekend met deze HTML-entiteitreferentie: " ". Deze 'geen-gebroken-ruimte'-entiteit wordt in HTML gebruikt om een extra ruimte in een document in te voegen.

Wanneer het document wordt geanalyseerd door een XML-parser, worden de entiteiten uitgebreid.

De volgende entiteiten zijn in XML voorgedefinieerd:

Entiteitreferentie Karakters
< <
> >
& &
" "
' '

PCDATA

PCDATA betekent geanalyseerde karaktergegevens (parsed character data).

Karaktergegevens kunnen worden voorgesteld als de tekst tussen de begin- en eindtags van een XML-element.

PCDATA wordt door de parser geanalyseerd. Deze teksten worden gecontroleerd op entiteiten en markeringen door de parser.

De tags in de tekst worden als markeringen behandeld, terwijl de inhoud wordt uitgebreid.

De door de parser geanalyseerde character data zou geen &、< of > tekens moeten bevatten; gebruik &、< en > entiteiten om hen respectievelijk te vervangen.

CDATA

CDATA betekent character data (character data).

CDATA wordt niet door de parser geanalyseerd.De tags in deze teksten worden niet als markeringen behandeld, en de entiteiten worden niet uitgebreid.