DTD - 元素与属性对比

Modul pembangunan utama untuk dokumen XML dan HTML adalah seperti tag <body>...</body> yang sama.

Modul pembangunan dokumen XML

Semua dokumen XML (dan dokumen HTML) terdiri dari modul pembangunan sederhana berikut:

  • Elemen
  • Atribut
  • Entitas
  • PCDATA
  • CDATA

Berikut adalah deskripsi singkat tentang setiap modul pembangunan.

Elemen

Elemen adalah modul utama dokumen XML dan HTMLModul utama pembangunan.

Contoh elemen HTML adalah "body" dan "table". Contoh elemen XML adalah "note" dan "message". Elemen dapat mengandung teks, elemen lainnya, atau kosong. Contoh elemen HTML kosong adalah "hr", "br", dan "img".

Contoh:

<body>body text in between</body>
<message>some message in between</message>

Atribut

Atribut dapat menyediakanInformasi ekstra tentang elemen.

Atribut selalu ditempatkan di tag awal suatu elemen. Atribut selalu dimulai denganNama/Nilaiberbentuk pasangan. Elemen "img" di bawah ini memiliki informasi ekstra tentang file sumber:

<img src="computer.gif" />

Nama elemen adalah "img". Nama atribut adalah "src". Nilai atribut adalah "computer.gif". Karena elemen itu sendiri kosong, ia ditutup dengan "/".

Entitas

Entitas digunakan untuk mendefiniskan variabel teks biasa. Referensi entitas adalah referensi ke entitas.

Sebagian besar murid mengenal referensi entitas HTML ini: " ". Entitas 'tidak berentang baris' ini digunakan di HTML untuk memasukkan spasi ekstra di dalam dokumen.

Ketika dokumen diparseh oleh pengeompal XML, entitas akan dijalankan.

Entitas di bawah ini telah didefinisi sebelumnya di XML:

Referensi entitas Karakter
< <
> >
& &
" "
' '

PCDATA

Arti PCDATA adalah data karakter yang diparseh (parsed character data).

Bisa berpikir data karakter seperti teks diantara tag awal dan tag akhir elemen XML.

PCDATA adalah teks yang akan diparseh pengeompal. Teks ini akan dicek entitas serta tanda.

Tanda di teks akan diproses sebagai tanda, sementara entitas akan dijalankan.

Tetapi, data karakter yang diparseh tidak boleh mengandung karakter &、< atau >; perlu menggunakan entitas &、< serta > untuk menggantikannya.

CDATA

CDATA 的意思是字符数据(character data)。

CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。