DTD - moduły budowania XML

Główne moduły budowlane dokumentów XML oraz HTML to takie znaczniki jak <body>....</body>.

Moduły budowlane dokumentów XML

Wszystkie dokumenty XML (oraz HTML) są zbudowane z następujących prostych modułów:

  • Elementy
  • Atrybuty
  • Jednostki
  • PCDATA
  • CDATA

Poniżej znajduje się krótki opis każdego modułu budowlanego.

Elementy

Elementy są głównymi modułami budowlanymi dokumentów XML oraz HTMLGłówne moduły budowlane.

Przykładami elementów HTML są "body" i "table". Przykładami elementów XML są "note" i "message". Elementy mogą zawierać tekst, inne elementy lub być puste. Przykładami pustych elementów HTML są "hr", "br" oraz "img".

Przykład:

<body>body text in between</body>
<message>some message in between</message>

Atrybuty

Atrybuty mogą dostarczaćDodatkowe informacje o elemencie.

Atrybuty są zawsze umieszczane w początkowym znaczniku elementu. Atrybuty zawsze zaczynają się odNazwa/WartośćDla parzystego występowania formy. Poniższy element "img" zawiera dodatkowe informacje o pliku źródłowym:

<img src="computer.gif" />

Nazwa elementu to "img". Nazwa atrybutu to "src". Wartość atrybutu to "computer.gif". Ponieważ element jest pusty, jest zamknięty " /".

Jednostki

Jednostki są zmiennymi do definiowania zwyczajnego tekstu. Odwołania do jednostek są odwołaniami do jednostek.

Większość z was zna ten HTML jednostkowy odwołanie: " ". Ta jednostka "bez przechodzenia do nowej linii" jest używana w HTML do wstawienia dodatkowego spacju w dokumencie.

Kiedy dokument jest analizowany przez analizator XML, jednostki są rozwijane.

Poniższe jednostki są predefiniowane w XML:

Odwołanie do jednostki Znak
< <
> >
& &
" "
' '

PCDATA

PCDATA oznacza przetworzone dane znakowe (parsed character data).

Można wyobrazić sobie dane znakowe jako tekst między znacznikami开始 i końcowymi etykiet XML.

PCDATA to tekst, który jest analizowany przez analizator. Te teksty będą sprawdzane przez analizator pod kątem jednostek oraz znaczników.

Znaki w tekście będą traktowane jako znaczniki, a jednostki będą rozwijane.

Jednak dane znakowe analizowane nie powinny zawierać znaków &、< lub >; należy je zastąpić odpowiednimi entytami &、< oraz >.

CDATA

CDATA oznacza dane znakowe (character data).

CDATA to tekst, który nie jest analizowany przez analizator.Znaki w tych tekstach nie będą traktowane jako znaczniki, a jednostki nie będą rozwijane.