DTD - XML-rakennusmoduuli

XML- ja HTML-dokumenttien pääasialliset rakennuspalikat ovat tällaisia <body>...</body>-taggeja.

XML-dokumentin rakennuspalikat

Kaikki XML-dokumentit (ja HTML-dokumentit) koostuvat seuraavista yksinkertaisista rakennuspalikoista:

  • elementti
  • Attribuutti
  • Entiteetti
  • PCDATA
  • CDATA

Jokaiselle rakennuspalikalle on annettu lyhyt kuvaus.

elementti

Elementit ovat XML- ja HTML-dokumenttienPääasialliset rakennuspalikat.

HTML-elementtien esimerkkejä ovat "body" ja "table". XML-elementtien esimerkkejä ovat "note" ja "message". Elementit voivat sisältää tekstiä, muita elementtejä tai olla tyhjiä. Tyhjän HTML-elementin esimerkkejä ovat "hr", "br" ja "img".

Esimerkki:

<body>keskellä oleva teksti</body>
<message>keskellä oleva jokin viesti</message>

Attribuutti

Attribuutti voi tarjotaElementin lisätietoja.

Attribuutit sijoitetaan aina johonkin elementin aloitusmerkkiin. Attribuutit ainaNimi/Arvomuodossa esiintyy parin muodossa. Seuraava "img"-elementti sisältää lisätietoja lähdetiedostosta:

<img src="computer.gif" />

Elementin nimi on "img". Attribuutin nimi on "src". Attribuutin arvo on "computer.gif". Koska elementti itsessään on tyhjä, se suljetaan merkillä "/".

Entiteetti

Entiteetti on määritetty tavallisen tekstin muuttuja. Entiteettiviittaus on entiteetin viittaus.

Useimmat oppilaat tuntevat tämän HTML-entiteettiviittauksen: " ". Tämä 'ei-vaihda-riviä' -entiteetti käytetään HTML:ssä yhtä ylimääräisen välilyönnin lisäämiseen johonkin dokumenttiin.

Kun dokumentti analysoidaan XML-analyysin avulla, entiteetit laajennetaan.

Seuraavat entiteetit on XML:ssä etukäteen määritelty:

Entiteettiviittaus Merkki
< <
> >
& &
" "
' \'

PCDATA

PCDATA tarkoittaa tulkittua merkkidataa (parsed character data).

Voit kuvitella merkkidataa XML-elementin aloitus- ja loppusulkujen välisenä tekstinä.

PCDATA on tulkittava teksti, jonka analyysin laite käsittelee. Näitä tekstejä analyysin laite tarkistaa entiteettejä ja merkkejä.

Tekstin merkinnät käsitellään merkkinä ja reaalinen teksti laajennetaan.

Mutta, analysoitujen merkkidatan ei tulisi sisältää minkään &、< tai >-merkkejä; niiden korvaamiseksi tarvitaan &、< ja >-olionimiä.

CDATA

CDATA 的意思是字符数据(character data)。

CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。