DTD - XML Bouwstenen

The main building blocks of XML and HTML documents are tags similar to <body>....</body>.

XML document building blocks

All XML documents (and HTML documents) are composed of the following simple building blocks:

  • Element
  • Attributes
  • Entiteit
  • PCDATA
  • CDATA

Below is a brief description of each building block.

Element

Elements are the building blocks of XML and HTML documentsMain building blocks.

Examples of HTML elements are "body" and "table". Examples of XML elements are "note" and "message". Elements can contain text, other elements, or be empty. Examples of empty HTML elements are "hr", "br", and "img".

Example:

<body>body text in between</body>
<message>some message in between</message>

Attributes

Attributes can provideAdditional information about an element.

Attributes are always placed within the start tag of an element. Attributes are always preceded byName/ValuePairwise appearing in the form. The following "img" elements contain additional information about the source file:

<img src="computer.gif" />

De naam van het element is "img". De naam van de eigenschap is "src". De waarde van de eigenschap is "computer.gif". Omdat het element zelf leeg is, wordt het afgesloten met een "/".

Entiteit

Entiteiten worden gebruikt om variabelen voor gewone tekst te definiëren. Entiteit verwijzingen zijn verwijzingen naar entiteiten.

De meeste studenten kennen deze HTML-entiteit: " ". Deze 'niet-gebroken regelruimte'-entiteit wordt in HTML gebruikt om een extra ruimte in een document in te voegen.

Wanneer het document wordt geanalyseerd door de XML-parser, worden de entiteiten uitgebreid.

De volgende entiteiten zijn vooraf gedefinieerd in XML:

Entiteit verwijzing Karakters
< <
> >
& &
" "
' '

PCDATA

PCDATA betekent parsed character data (geanalyseerde character data).

Je kunt character data voorstellen als tekst tussen de begin- en eindtags van een XML-element.

PCDATA wordt geanalyseerd door de parser. Deze teksten worden gecontroleerd op entiteiten en markeringen door de parser.

De tags in de tekst worden als markeringen behandeld, en de entiteiten worden uitgebreid.

Maar de geanalyseerde character data mogen geen &、< of >-tekens bevatten; gebruik &、< en >-entiteiten om deze te vervangen.

CDATA

CDATA betekent character data (character data).

CDATA is tekst die niet wordt geanalyseerd door de parser.De tags in deze teksten worden niet als markeringen behandeld, en de entiteiten worden niet uitgebreid.