DTD - element sammenlignet med egenskab

De vigtigste byggestene i XML og HTML-dokumenter er mærker som <body>....</body>.

XML-dokumentbyggesten

Alle XML-dokumenter (og HTML-dokumenter) består af følgende enkle byggesten:

  • elementer
  • Attribute
  • Entity
  • PCDATA
  • CDATA

Her er en kort beskrivelse af hver byggesten.

elementer

Elementer er XML og HTML-dokumentersHovedbyggesten

Eksempler på HTML-elementer er "body" og "table". Eksempler på XML-elementer er "note" og "message". Elementer kan indeholde tekst, andre elementer eller være tomme. Eksempler på tomme HTML-elementer er "hr"、"br" og "img".

Eksempel:

<body>tekst mellem</body>
<message>en besked mellem</message>

Attribute

Attribute kan tilbydeYderligere information om elementet

Attribute placeres altid i en elements startetiket. Attribute er altidNavn/Værdier formet som parvis. Følgende "img" element har yderligere information om kildefilen:

<img src="computer.gif" />

Elementets navn er "img". Attributnavnet er "src". Attributværdien er "computer.gif". Da elementet selv er tomt, bliver det lukket med en "/".

Entity

Entityer bruges til at definere variable for almindelig tekst. Entityreference er en reference til en entity.

De fleste studerende kender denne HTML entityreference: " ". Denne 'uden afbrydelse mellem linjer' entity bruges i HTML til at indsætte en ekstra mellemrum i et dokument.

Når dokumentet parses af en XML-parser, vil entityerne blive udfoldet.

Følgende entityer er prædefineret i XML:

Entityreference Tegn
< <
> >
& &
" "
' '

PCDATA

PCDATA betyder parsed character data (parsed character data).

Man kan forestille sig tegndata som teksten mellem en XML-elementets start- og slutetiketter.

PCDATA er tekst, der vil blive parseret af parseren. Denne tekst vil blive kontrolleret for entityer og mærker af parseren.

Tekstmedtagelser vil blive behandlet som mærker, mens entityer vil blive udfoldet.

Men, de parsede tegndata skal ikke indeholde nogen &、< eller > tegn;det er nødvendigt at bruge &、< og > entiteter til at erstatte dem.

CDATA

CDATA betyder character data (character data).

CDATA er tekst, der ikke vil blive fortolket af parseren.Mærkerne i disse tekster vil ikke blive behandlet som mærker, og de entityer vil ikke blive udfoldet.