DTD - Modul Pembangunan XML

Modul utama dalam dokumen XML dan HTML adalah seperti tag <body>...</body> yang mirip.

Modul pembangunan dokumen XML

Semua dokumen XML (dan HTML) hanya terdiri dari modul pembangunan sederhana berikut:

  • Elemen
  • Atribut
  • Entitas
  • PCDATA
  • CDATA

Berikut adalah deskripsi singkat dari setiap modul pembangunan.

Elemen

Elemen adalah modul utama dalam dokumen XML dan HTMLModul utama pembangunan.

Contoh elemen HTML adalah "body" dan "table". Contoh elemen XML adalah "note" dan "message". Elemen dapat mengandung teks, elemen lainnya, atau kosong. Contoh elemen HTML kosong adalah "hr", "br", dan "img".

Contoh:

<body>body text in between</body>
<message>some message in between</message>

Atribut

Atribut dapat menyediakanInformasi ekstra tentang elemen.

Atribut selalu ditempatkan di dalam tag awal suatu elemen. Atribut selalu dimulai denganNama/Nilaiberbentuk pasangan. Elemen "img" di bawah ini memiliki informasi ekstra tentang berkas sumber:

<img src="computer.gif" />

Nama elemen adalah "img". Nama atribut adalah "src". Nilai atribut adalah "computer.gif". Karena elemen itu sendiri kosong, ia ditutup dengan "/".

Entitas

Entitas digunakan untuk mendefinikan variabel teks biasa. Penggunaan referensi entitas adalah referensi ke entitas.

Sebagian besar teman mengenal referensi entitas HTML ini: " ". Entitas 'tidak garis bawah' ini digunakan di HTML untuk menambahkan spasi ekstra di dalam dokumen.

Ketika dokumen diurai oleh parser XML, entitas akan dipecahkan.

Entitas di bawah ini telah didefinisi sebelumnya dalam XML:

Penggunaan referensi entitas Karakter
< <
> >
& &
" "
' '

PCDATA

PCDATA berarti data karakter yang diurai (parsed character data).

Bisa berfikir tentang data karakter seperti teks yang berada di antara tag awal dan tag akhir elemen XML.

PCDATA adalah teks yang akan diurai oleh parser. Teks ini akan dicek oleh parser untuk entitas dan penanda.

Tanda yang ada di teks akan dianggap sebagai penanda, sementara entitas akan dipecahkan.

不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 实体来分别替换它们。

CDATA

CDATA 的意思是字符数据(character data)。

CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。