Regole di sintassi XML
- Pagina precedente Struttura ad albero XML
- Pagina successiva Elementi XML
Le regole di sintassi dell'XML sono semplici e logiche. Queste regole sono facili da imparare e da utilizzare.
Un documento XML deve avere un elemento radice
Un documento XML deve contenere unelemento radice, quest'elemento è il padre di tutti gli altri elementielemento padre:
<root> <child> <subchild>.....</subchild> </child> </root>
In questo esempio:<note>
è l'elemento radice:
<?xml version="1.0" encoding="UTF-8"?> <note> <to>George</to> <from>John</from> <heading>Richiamo</heading> <body>Non dimenticare l'incontro!</body> </note>
Introduzione XML (XML Prolog)
Questa riga è chiamata XML Introduzione:
<?xml version="1.0" encoding="UTF-8"?>
L'introduzione XML è opzionale. Se esiste, deve essere situata nella prima riga del documento.
I documenti XML possono contenere caratteri internazionali, ad esempio norvegese øæå o francese êèé.
Per evitare errori, dovresti specificare la codifica utilizzata e salvare il file XML come UTF-8.
UTF-8 è la codifica predefinita per i documenti XML.
Puoi trovare i nostriCorso di charsetimparare le codifiche dei caratteri.
Suggerimento:UTF-8 è la codifica predefinita per HTML5, CSS, JavaScript, PHP e SQL.
Tutti gli elementi XML devono avere un tag di fine
In XML, l'omissione dei tag di fine è illegale. Tutti gli elementi devonoIn XML, tutti gli elementiHanno un tag di fine:
<p>This is a paragraph.</p> <br />
Attenzione:L'introduzione XML non ha un tag di fine! Questo non è un errore. L'introduzione non fa parte del corpus dell'XML. Non è un elemento XML e non richiede un tag di chiusura.
Le etichette XML distinguono tra maiuscole e minuscole
Le etichette XML distinguono tra maiuscole e minuscole. L'etichetta <Letter> è diversa dall'etichetta <letter>.
Le etichette di inizio e di fine devono avere la stessa maiuscolarità:
<message>This is correct</message>
Commento:L'apertura e la chiusura dei tag sono solitamente chiamati etichette di inizio e etichette di fine. Non importa quale termine preferisci, il concetto è lo stesso.
XML 元素必须正确嵌套
Gli elementi XML devono essere incapsulati correttamente
Potresti vedere elementi non correttamente incapsulati in HTML:
<b><i>Questo testo è grassetto e corsivo</b></i>In XML, tutti gli elementiObbligatorio
Incorporazione corretta
<b><i>Questo testo è grassetto e corsivo</i></b>
Nel esempio sopra, il significato corretto dell'incapsulamento è: poiché l'elemento <i> è stato aperto all'interno dell'elemento <b>, deve essere chiuso all'interno dell'elemento <b>.
I valori degli attributi XML devono essere racchiusi tra virgolette
Analogamente a HTML, XML può avere attributi ( coppie di nome/valore).
<note date="12/11/2007"> <to>George</to> <from>John</from> </note>
Riferimento alle entità
In XML, alcuni caratteri hanno un significato speciale.
Se metti il carattere "<" all'interno di un elemento XML, si verificherà un errore, poiché l'analizzatore lo considererà come l'inizio di un nuovo elemento.
Questo produrrà un errore XML:
<message>if salary < 1000 then</message>
Per evitare questo errore, utilizzareRiferimento alle entitàper sostituire il carattere "<"
<message>if salary < 1000 then</message>
In XML ci sono 5 riferimenti predefiniti di entità:
< | < | Minuscolo |
> | > | Maiuscolo |
& | & | E commerciale |
' | ' | Virgolette singole |
" | " | Virgolette |
Commento:In XML, solo i caratteri "<" e "&"" sono effettivamente illegali. > è legittimo, ma l'abitudine di usarlo al posto suo è buona.
Commenti in XML
La sintassi per scrivere commenti in XML è molto simile a quella di HTML:
<!-- Questo è un commento -->
Non è permesso avere due trattini di meno nel mezzo di un commento:
<!-- Questo è un commento non valido -->
In XML, gli spazi bianchi vengono conservati
HTML riduce (unisce) più spazi连续的空格字符 a uno, mentre in XML, gli spazi nel documento non vengono eliminati:
XML: Ciao George HTML: Ciao George
XML memorizza il nuovo riavvio come LF
Nelle applicazioni Windows, il riavvio della riga viene memorizzato con un paio di caratteri: il carattere di ritorno a capo (CR) e il carattere di newline (LF). Questo paio di caratteri ha una somiglianza con l'azione di impostare una nuova riga su una macchina da scrivere.
Unix e Mac OSX utilizzano LF.
I vecchi sistemi Mac utilizzano CR.
XML memorizza le nuove righe come LF.
XML ben formato
Un documento XML che rispetta le regole di grammatica sopra menzionate viene chiamato documento XML 'ben formato'.
- Pagina precedente Struttura ad albero XML
- Pagina successiva Elementi XML