XML-syntaksregler
- Föregående sida XML-trädstruktur
- Nästa sida XML-element
XML:s syntaxregler är enkla och logiska. Dessa regler är lätt att lära sig och använda.
XML-dokument måste ha ett rotlement
XML-dokument måste innehålla ettRotlementetdenna element är föräldrellement till alla andra elementFöräldrellement:
<root> <child> <subchild>.....</subchild> </child> </root>
I detta exempel:<note>
är rotlementet:
<?xml version="1.0" encoding="UTF-8"?> <note> <to>George</to> <from>John</from> <heading>Påminnelse</heading> <body>Glöm inte mötet!</body> </note>
XML-prolog (XML Prolog)
Detta raden kallas XML Prolog:
<?xml version="1.0" encoding="UTF-8"?>
XML-prologen är valfri. Om den finns måste den vara på dokumentets första rad.
XML-dokument kan innehålla internationella tecken, till exempel norska øæå eller franska êèé.
För att undvika fel bör du specificera den kodning du använder och spara XML-filen som UTF-8.
UTF-8 är standardteckenkodningen för XML-dokument.
Du kan hitta i vårTeckenuppsättningstutorialstudera teckenkodning här
Tips:UTF-8 är standardkodningen för HTML5, CSS, JavaScript, PHP och SQL.
Alla XML-element måste ha en slutsetikel
I XML är det olagligt att utelämna slutsetiketter. Alla element måsteMåstehar en slutsetikel:
<p>This is a paragraph.</p> <br />
Observera:XML-prologen har ingen slutsetikel. Detta är inte ett fel. Prologen är inte en del av XML självt. Det är inte ett XML-element och behöver inte stängas.
XML-setiketter skiljer mellan storlek på bokstäver
XML-setiketter skiljer mellan storlek på bokstäver. Setiketten <Letter> är annorlunda från setiketten <letter>.
Början och slutsetiketter måste användas med samma storlek på bokstäver:
<message>This is correct</message>
Kommentar:Öppna och stäng etiketter kallas ofta för börjansetiketter och slutsetiketter. Oavsett vilken term du föredrar är deras koncept samma.
XML-element måste vara korrekt inbäddade
I HTML kan du se element utan korrekt inbäddning:
<b><i>This text is bold and italic</b></i>
I XML måste alla elementMåsteKorrekt inbäddning:
<b><i>This text is bold and italic</i></b>
I det ovanstående exemplet innebär korrekt inbäddning att eftersom <i>-elementet öppnas inom <b>-elementet, måste det också stängas inom <b>-elementet.
XML-attributvärden måste vara inom citationstecken
Som HTML kan XML också ha egenskaper (namn/värde-paarer).
Liksom HTML måste XML:s attributvärden vara inom citationstecken:
<note date="12/11/2007"> <to>George</to> <from>John</from> </note>
Entitetsreferenser
I XML har vissa tecken ett särskilt betydelse.
Om du lägger till tecknet "<" i en XML-element, kommer det att uppstå ett fel, eftersom解析aren kommer att tolka det som en början på en ny element.
Detta kommer att skapa ett XML-fel:
<message>om lön < 1000 då</message>
För att undvika denna fel, användEntitetsreferenseratt ersätta tecknet "<":
<message>om lön < 1000 då</message>
I XML finns det 5 fördefinierade entitetsreferenser:
< | < | Mindre än |
> | > | Större än |
& | & | Och-tecken |
' | ' | Enstaka citattecken |
" | " | Citat |
Kommentar:I XML är endast tecknen "<" och "" verkligen olagliga. > är lagligt, men det är en bra vana att använda > för att ersätta det.
XML-kommentarer
Satsen för att skriva kommentarer i XML liknar HTML:s syntax:
<!-- Detta är en kommentar -->
Det är inte tillåtet att ha två backsteg i kommentarerna:
<!-- Detta är ett ogiltigt -- kommentar -->
XML behåller tomma tecken
HTML minskar (förenar) flera upprepade mellanslag till ett enda tecken, i XML raderas inte mellanslag i dokumentet:
XML: Hej George HTML: Hej George
XML lagrar ny rad som LF
I Windows-program, lagras radbrytning vanligtvis som ett par tecken: returtecken (CR) och nylinjetecken (LF). Detta par tecken har likheter med handlingen att skapa en ny rad på en skrivmaskin.
Unix och Mac OSX använder LF.
Gamla Mac-system använder CR.
XML lagrar nya rader som LF.
Korrekt formaterad XML
XML-dokument som överensstämmer med ovanstående grammatiska regler kallas 'korrekt formaterade' XML-dokument.
- Föregående sida XML-trädstruktur
- Nästa sida XML-element