DTD - Elementen versus eigenschappen

De hoofdconstructie-elementen van XML- en HTML-documenten zijn tags zoals <body>...</body>.

XML-documentconstructie-elementen

Alle XML-documenten (en HTML-documenten) bestaan uit de volgende eenvoudige constructie-elementen:

  • Elementen
  • Eigenschappen
  • Entiteit
  • PCDATA
  • CDATA

Hier is een korte beschrijving van elk constructie-element.

Elementen

Elementen zijn de hoofdconstructie-elementen van XML- en HTML-documentenHoofdconstructie-elementen

Voorbeelden van HTML-elementen zijn "body" en "table". Voorbeelden van XML-elementen zijn "note" en "message". Elementen kunnen tekst, andere elementen of leeg zijn. Voorbeelden van lege HTML-elementen zijn "hr", "br" en "img".

Voorbeeld:

<body>tekst in tussen</body>
<message>een bericht in tussen</message>

Eigenschappen

Eigenschappen kunnenExtra informatie over het element

Eigenschappen worden altijd geplaatst in de begin-tag van een element. Eigenschappen beginnen altijd metnaam/waardeworden paarsgewijs voorkomend. De volgende "img"-element bevat extra informatie over de bronbestand:

<img src="computer.gif" />

De naam van het element is "img". De naam van het attribuut is "src". De waarde van het attribuut is "computer.gif". Omdat het element zelf leeg is, wordt het afgesloten met een "/".

Entiteit

Entiteiten worden gebruikt om variabelen voor gewone tekst te definiëren. Een entiteitreferentie is een verwijzing naar een entiteit.

De meeste studenten zijn bekend met deze HTML-entiteitreferentie: " ". Deze 'geen-gebreukelijke-ruimte'-entiteit wordt in HTML gebruikt om een extra ruimte in een document in te voegen.

Wanneer een document wordt geparseerd door een XML-parser, worden de entiteiten uitgebreid.

De volgende entiteiten zijn vooraf gedefinieerd in XML:

entiteitreferentie tekens
< <
> >
& &
" "
' '

PCDATA

PCDATA betekent geparseerde tekengegevens (parsed character data).

Denk aan tekengegevens als de tekst tussen de begin- en eindtags van een XML-element.

PCDATA wordt door de parser geparseerd. Deze teksten worden gecontroleerd op entiteiten en markeringen.

Labels in de tekst worden behandeld als markeringen, terwijl entiteiten worden uitgebreid.

Maar, de geparseerde tekengegevens mogen geen &-, <- of >-tekens bevatten; gebruik &, < en > om hen te vervangen.

CDATA

CDATA betekent character data (character data).

CDATA wordt niet door de parser geanalyseerd.De tags in deze teksten worden niet als markeringen behandeld, en de entiteiten worden niet uitgebreid.