XML-syntaksregler

XML:s syntaxregler är enkla och logiska. Dessa regler är lätt att lära sig och använda.

XML-dokument måste ha ett rotlement

XML-dokument måste innehålla ettRotlementetdenna element är föräldrellement till alla andra elementFöräldrellement:

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

I detta exempel:<note> är rotlementet:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Påminnelse</heading>
  <body>Glöm inte mötet!</body>
</note>

XML-prolog (XML Prolog)

Detta raden kallas XML Prolog:

<?xml version="1.0" encoding="UTF-8"?>

XML-prologen är valfri. Om den finns måste den vara på dokumentets första rad.

XML-dokument kan innehålla internationella tecken, till exempel norska øæå eller franska êèé.

För att undvika fel bör du specificera den kodning du använder och spara XML-filen som UTF-8.

UTF-8 är standardteckenkodningen för XML-dokument.

Du kan hitta i vårTeckenuppsättningstutorialstudera teckenkodning här

Tips:UTF-8 är standardkodningen för HTML5, CSS, JavaScript, PHP och SQL.

Alla XML-element måste ha en slutsetikel

I XML är det olagligt att utelämna slutsetiketter. Alla element måsteMåstehar en slutsetikel:

<p>This is a paragraph.</p>
<br />

Observera:XML-prologen har ingen slutsetikel. Detta är inte ett fel. Prologen är inte en del av XML självt. Det är inte ett XML-element och behöver inte stängas.

XML-setiketter skiljer mellan storlek på bokstäver

XML-setiketter skiljer mellan storlek på bokstäver. Setiketten <Letter> är annorlunda från setiketten <letter>.

Början och slutsetiketter måste användas med samma storlek på bokstäver:

<message>This is correct</message>

Kommentar:Öppna och stäng etiketter kallas ofta för börjansetiketter och slutsetiketter. Oavsett vilken term du föredrar är deras koncept samma.

XML-element måste vara korrekt inbäddade

I HTML kan du se element utan korrekt inbäddning:

<b><i>This text is bold and italic</b></i>

I XML måste alla elementMåsteKorrekt inbäddning:

<b><i>This text is bold and italic</i></b>

I det ovanstående exemplet innebär korrekt inbäddning att eftersom <i>-elementet öppnas inom <b>-elementet, måste det också stängas inom <b>-elementet.

XML-attributvärden måste vara inom citationstecken

Som HTML kan XML också ha egenskaper (namn/värde-paarer).

Liksom HTML måste XML:s attributvärden vara inom citationstecken:

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Entitetsreferenser

I XML har vissa tecken ett särskilt betydelse.

Om du lägger till tecknet "<" i en XML-element, kommer det att uppstå ett fel, eftersom解析aren kommer att tolka det som en början på en ny element.

Detta kommer att skapa ett XML-fel:

<message>om lön < 1000 då</message>

För att undvika denna fel, användEntitetsreferenseratt ersätta tecknet "<":

<message>om lön < 1000 då</message>

I XML finns det 5 fördefinierade entitetsreferenser:

< < Mindre än
> > Större än
& & Och-tecken
' ' Enstaka citattecken
" " Citat

Kommentar:I XML är endast tecknen "<" och "" verkligen olagliga. > är lagligt, men det är en bra vana att använda > för att ersätta det.

XML-kommentarer

Satsen för att skriva kommentarer i XML liknar HTML:s syntax:

<!-- Detta är en kommentar -->

Det är inte tillåtet att ha två backsteg i kommentarerna:

<!-- Detta är ett ogiltigt -- kommentar -->

XML behåller tomma tecken

HTML minskar (förenar) flera upprepade mellanslag till ett enda tecken, i XML raderas inte mellanslag i dokumentet:

XML:	Hej           George
HTML:	Hej George

XML lagrar ny rad som LF

I Windows-program, lagras radbrytning vanligtvis som ett par tecken: returtecken (CR) och nylinjetecken (LF). Detta par tecken har likheter med handlingen att skapa en ny rad på en skrivmaskin.

Unix och Mac OSX använder LF.

Gamla Mac-system använder CR.

XML lagrar nya rader som LF.

Korrekt formaterad XML

XML-dokument som överensstämmer med ovanstående grammatiska regler kallas 'korrekt formaterade' XML-dokument.