Aturan Syntax XML

Aturan sintaksis XML sangat sederhana dan logis. Aturan ini mudah untuk dipelajari dan mudah digunakan.

Dokumen XML harus memiliki elemen utama

Dokumen XML harus mengandung satuElemen utamadan elemen ini adalah induk dari semua elemen lainnyaElemen induk:

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

Dalam contoh ini,<note> adalah elemen utama:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Peringatan</heading>
  <body>Jangan lupa pertemuan!</body>
</note>

Declarasi XML (XML Prolog)

Baris ini disebut baris XML Declarasi:

<?xml version="1.0" encoding="UTF-8"?>

Declarasi XML adalah opsional. Jika ada, maka harus berada di baris pertama dokumen.

Dokumen XML dapat mengandung karakter internasional, seperti bahasa Norwegia øæå atau bahasa Perancis êèé.

Untuk menghindari kesalahan, Anda seharusnya menentukan enkoding yang digunakan dan simpan berkas XML dalam UTF-8.

UTF-8 adalah karakter enkoding default untuk dokumen XML.

Anda dapat mengakses diTutorial karakter setdalam belajar karakter enkoding.

Pemberitahuan:UTF-8 adalah enkoding default untuk HTML5, CSS, JavaScript, PHP, dan SQL.

Semua elemen XML harus memiliki tag penutup

Pada XML, penghapusan tag penutup adalah ilegal. Semua elemen harusWajibMemiliki tag penutup:

<p>This is a paragraph.</p>
<br />

Perhatian:Declarasi XML tidak memiliki tag akhir! Ini bukan kesalahan. Declarasi bukan bagian dari XML sendiri. Ini bukan elemen XML dan tidak memerlukan tag penutup.

Tag XML membedakan huruf besar

Tag XML membedakan huruf besar. Tag <Letter> berbeda dengan tag <letter>.

Tag awal dan tag akhir harus menggunakan huruf besar yang sama:

<message>This is correct</message>

Komentar:Buka dan tutup tag biasanya disebut tag awal dan tag akhir. Tidak penting Anda suka istilah mana, konsepnya sama.

Elemen XML harus ditumpuk dengan benar

Di HTML, Anda mungkin melihat elemen yang tidak ditumpuk dengan benar:

<b><i>This text is bold and italic</b></i>

Di XML, semua elemenWajibTumpukan yang benar

<b><i>This text is bold and italic</i></b>

Di contoh di atas, makna yang benar adalah: karena elemen <i> dibuka di dalam elemen <b>, maka ia harus ditutup di dalam elemen <b>.

Nilai atribut XML harus diutamakan

Seperti HTML, XML juga dapat memiliki atribut (pasangan nama/nilai).

Di XML, nilai atribut XML harus diutamakan:

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Referensi entitas

Di XML, beberapa karakter memiliki makna khusus.

Jika Anda menempatkan karakter "<" di dalam elemen XML, akan terjadi kesalahan, karena parser akan menganggapnya sebagai awal elemen baru.

ini akan memicu kesalahan XML:

<message>if salary < 1000 then</message>

Untuk menghindari kesalahan ini, gunakanReferensi entitasuntuk menggantikan karakter "<"

<message>if salary < 1000 then</message>

Di XML, ada 5 referensi entitas yang diatur:

< < kecil
> > besar
& & dan
' ' '
" " "

Komentar:Di XML, hanya karakter "<" dan "&"" yang sebenarnya ilegal. > adalah yang sah, tetapi berani untuk menggantikannya adalah hal yang baik.

Komentar di XML

Tata bahasa menulis komentar di XML sangat mirip dengan HTML:

<!-- Ini adalah komentar -->

Tidak diizinkan untuk ada tiga tanda hubung di tengah komentar:

<!-- Ini adalah komentar yang salah -->

XML menahan spasi

HTML akan memotong spasi berurutan berjumlah yang sama menjadi satu, sedangkan di XML, spasi di dalam dokumen tidak akan dihilangkan:

XML: Halo                   George
HTML: Halo George

XML menyimpan baris baru dengan LF

Pada aplikasi Windows, paragraf baru disimpan dengan pasangan karakter: karakter Enter (CR) dan karakter newline (LF). Pasangan karakter ini mirip dengan tindakan menulis baris baru perekam kata.

Unix 和 Mac OSX 使用 LF。

旧的 Mac 系统使用 CR。

XML 将新行存储为 LF。

格式良好的 XML

符合上述语法规则的 XML 文档被称为“格式良好”的 XML 文档。