DTD - 元素与属性对比
Modul pembangunan utama untuk dokumen XML dan HTML adalah seperti tag <body>...</body> yang sama.
Modul pembangunan dokumen XML
Semua dokumen XML (dan dokumen HTML) terdiri dari modul pembangunan sederhana berikut:
- Elemen
- Atribut
- Entitas
- PCDATA
- CDATA
Berikut adalah deskripsi singkat tentang setiap modul pembangunan.
Elemen
Elemen adalah modul utama dokumen XML dan HTMLModul utama pembangunan.
Contoh elemen HTML adalah "body" dan "table". Contoh elemen XML adalah "note" dan "message". Elemen dapat mengandung teks, elemen lainnya, atau kosong. Contoh elemen HTML kosong adalah "hr", "br", dan "img".
Contoh:
<body>body text in between</body> <message>some message in between</message>
Atribut
Atribut dapat menyediakanInformasi ekstra tentang elemen.
Atribut selalu ditempatkan di tag awal suatu elemen. Atribut selalu dimulai denganNama/Nilaiberbentuk pasangan. Elemen "img" di bawah ini memiliki informasi ekstra tentang file sumber:
<img src="computer.gif" />
Nama elemen adalah "img". Nama atribut adalah "src". Nilai atribut adalah "computer.gif". Karena elemen itu sendiri kosong, ia ditutup dengan "/".
Entitas
Entitas digunakan untuk mendefiniskan variabel teks biasa. Referensi entitas adalah referensi ke entitas.
Sebagian besar murid mengenal referensi entitas HTML ini: " ". Entitas 'tidak berentang baris' ini digunakan di HTML untuk memasukkan spasi ekstra di dalam dokumen.
Ketika dokumen diparseh oleh pengeompal XML, entitas akan dijalankan.
Entitas di bawah ini telah didefinisi sebelumnya di XML:
Referensi entitas | Karakter |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
Arti PCDATA adalah data karakter yang diparseh (parsed character data).
Bisa berpikir data karakter seperti teks diantara tag awal dan tag akhir elemen XML.
PCDATA adalah teks yang akan diparseh pengeompal. Teks ini akan dicek entitas serta tanda.
Tanda di teks akan diproses sebagai tanda, sementara entitas akan dijalankan.
Tetapi, data karakter yang diparseh tidak boleh mengandung karakter &、< atau >; perlu menggunakan entitas &、< serta > untuk menggantikannya.
CDATA
CDATA 的意思是字符数据(character data)。
CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。