Regole di sintassi XML

Le regole di sintassi dell'XML sono semplici e logiche. Queste regole sono facili da imparare e da utilizzare.

Un documento XML deve avere un elemento radice

Un documento XML deve contenere unelemento radice, quest'elemento è il padre di tutti gli altri elementielemento padre:

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

In questo esempio:<note> è l'elemento radice:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Richiamo</heading>
  <body>Non dimenticare l'incontro!</body>
</note>

Introduzione XML (XML Prolog)

Questa riga è chiamata XML Introduzione:

<?xml version="1.0" encoding="UTF-8"?>

L'introduzione XML è opzionale. Se esiste, deve essere situata nella prima riga del documento.

I documenti XML possono contenere caratteri internazionali, ad esempio norvegese øæå o francese êèé.

Per evitare errori, dovresti specificare la codifica utilizzata e salvare il file XML come UTF-8.

UTF-8 è la codifica predefinita per i documenti XML.

Puoi trovare i nostriCorso di charsetimparare le codifiche dei caratteri.

Suggerimento:UTF-8 è la codifica predefinita per HTML5, CSS, JavaScript, PHP e SQL.

Tutti gli elementi XML devono avere un tag di fine

In XML, l'omissione dei tag di fine è illegale. Tutti gli elementi devonoIn XML, tutti gli elementiHanno un tag di fine:

<p>This is a paragraph.</p>
<br />

Attenzione:L'introduzione XML non ha un tag di fine! Questo non è un errore. L'introduzione non fa parte del corpus dell'XML. Non è un elemento XML e non richiede un tag di chiusura.

Le etichette XML distinguono tra maiuscole e minuscole

Le etichette XML distinguono tra maiuscole e minuscole. L'etichetta <Letter> è diversa dall'etichetta <letter>.

Le etichette di inizio e di fine devono avere la stessa maiuscolarità:

<message>This is correct</message>

Commento:L'apertura e la chiusura dei tag sono solitamente chiamati etichette di inizio e etichette di fine. Non importa quale termine preferisci, il concetto è lo stesso.

XML 元素必须正确嵌套

Gli elementi XML devono essere incapsulati correttamente

Potresti vedere elementi non correttamente incapsulati in HTML:

<b><i>Questo testo è grassetto e corsivo</b></i>In XML, tutti gli elementiObbligatorio

Incorporazione corretta

<b><i>Questo testo è grassetto e corsivo</i></b>

Nel esempio sopra, il significato corretto dell'incapsulamento è: poiché l'elemento <i> è stato aperto all'interno dell'elemento <b>, deve essere chiuso all'interno dell'elemento <b>.

I valori degli attributi XML devono essere racchiusi tra virgolette

Analogamente a HTML, XML può avere attributi ( coppie di nome/valore).

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Riferimento alle entità

In XML, alcuni caratteri hanno un significato speciale.

Se metti il carattere "<" all'interno di un elemento XML, si verificherà un errore, poiché l'analizzatore lo considererà come l'inizio di un nuovo elemento.

Questo produrrà un errore XML:

<message>if salary < 1000 then</message>

Per evitare questo errore, utilizzareRiferimento alle entitàper sostituire il carattere "<"

<message>if salary < 1000 then</message>

In XML ci sono 5 riferimenti predefiniti di entità:

< < Minuscolo
> > Maiuscolo
& & E commerciale
' ' Virgolette singole
" " Virgolette

Commento:In XML, solo i caratteri "<" e "&"" sono effettivamente illegali. > è legittimo, ma l'abitudine di usarlo al posto suo è buona.

Commenti in XML

La sintassi per scrivere commenti in XML è molto simile a quella di HTML:

<!-- Questo è un commento -->

Non è permesso avere due trattini di meno nel mezzo di un commento:

<!-- Questo è un commento non valido -->

In XML, gli spazi bianchi vengono conservati

HTML riduce (unisce) più spazi连续的空格字符 a uno, mentre in XML, gli spazi nel documento non vengono eliminati:

XML: Ciao           George
HTML: Ciao George

XML memorizza il nuovo riavvio come LF

Nelle applicazioni Windows, il riavvio della riga viene memorizzato con un paio di caratteri: il carattere di ritorno a capo (CR) e il carattere di newline (LF). Questo paio di caratteri ha una somiglianza con l'azione di impostare una nuova riga su una macchina da scrivere.

Unix e Mac OSX utilizzano LF.

I vecchi sistemi Mac utilizzano CR.

XML memorizza le nuove righe come LF.

XML ben formato

Un documento XML che rispetta le regole di grammatica sopra menzionate viene chiamato documento XML 'ben formato'.