XML Syntaksregler

XML's syntaksregler er enkle og logiske. Disse regler er nemme at lære og bruge.

XML-dokumentet skal have et rod element

XML-dokumentet skal indeholde enRod elementog elementet er alle andre elementersForældrelement:

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

I dette eksempel:<note> er rod elementet:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Reminder</heading>
  <body>Don't forget the meeting!</body>
</note>

XML prolog (XML Prolog)

Denne linje kaldes XML Prolog:

<?xml version="1.0" encoding="UTF-8"?>

XML prologen er valgfri. Hvis den findes, skal den være placeret på dokumentets første linje.

XML-dokumenter kan indeholde internationale tegn, såsom norsk øæå eller fransk êèé.

For at undgå fejl bør du specificere den anvendte koding og gemme XML-filen som UTF-8.

UTF-8 er standardkodingen for XML-dokumenter.

Du kan finde voresTegnsætningstutorialunder læring af tegnsætning.

Vedligeholdelse:UTF-8 er standardkodingen for HTML5, CSS, JavaScript, PHP og SQL.

Alle XML elementer skal have sluttags

I XML er det ulovligt at undlade slutmærker. Alle elementer skalMåsteHar sluttag:

<p>Dette er en afsnit.</p>
<br />

Bemærk:XML prologen har ingen sluttag! Dette er ikke en fejl. Prologen er ikke en del af XML selv. Det er ikke et XML-element og kræver ikke et sluttag.

XML tags adskiller store/kleine bogstaver

XML tags adskiller store/kleine bogstaver. Tag <Letter> er forskelligt fra tag <letter>.

Begge start- og sluttags skal bruge samme store/kleine bogstaver:

<message>Dette er korrekt</message>

Kommentar:Åbne og lukke tags kaldes normalt starttags og sluttags. Uanset hvilken terminologi du foretrækker, er konceptet det samme.

XML-elementer skal være korrekt indlejret

I HTML kan du muligvis se elementer, der ikke er korrekt indlejret:

<b><i>Dette tekst er fed og kursiv</b></i>

I XML skal alle elementerMåsteKorrekt indlejring

<b><i>Dette tekst er fed og kursiv</i></b>

I det ovenstående eksempel betyder det korrekt indlejring, at da <i>-elementet åbnes inden i <b>-elementet, skal det lukkes inden i <b>-elementet.

XML's egenskabsværdier skal være anført i citattegn

Ligesom HTML kan XML også have egenskaber (navne/værdipar).

Ligesom HTML skal XML's egenskabsværdier være anført i citattegn:

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Entity-referencer

Nogle tegn har en speciel betydning i XML.

Hvis du lægger tegnet "<" i et XML-element, vil det forårsage en fejl, fordi parseren vil se det som start af et nyt element.

Dette vil producere en XML-fejl:

<message>hvis løn < 1000 så</message>

For at undgå denne fejl, brugEntity-referencerfor at erstatte "<"-tegnet:

<message>hvis løn < 1000 så</message>

I XML findes der 5 prædefinerede entity-referencer:

< < Mindre end
> > Større end
& & Og-tegnet
' ' Enkel citattegn
" " Citattegn

Kommentar:I XML er kun tegnet "<" og """ virkelig ulovlige. > er lovligt, men det er en god vane at erstatte det med >.

XML-kommentarer

Sprogskriptet til at skrive kommentarer i XML er meget lignende til HTML:

<!-- Dette er en kommentar -->

Der er ikke tilladt to bindestreger i kommentar-mellemrummet:

<!-- Dette er en ugyldig -- kommentar -->

XML bevarer tomrum

HTML reducerer flere sammenhængende mellemrum til én, i XML bliver der ikke fjernet mellemrum i dokumentet:

XML: Hej           George
HTML: Hej George

XML gemmer linjeskift som LF

I Windows-programmer gemmes linjeskift normalt med et par tegn: returskift (CR) og linjeskift (LF). Dette par af tegn har en lignende handling til at sætte en ny linje på en skrivemaskine.

Unix og Mac OSX bruger LF.

Gamle Mac-systemer bruger CR.

XML lagrer nye linjer som LF.

Format korrekte XML

XML-dokumenter, der opfylder ovennævnte syntaksregler, kaldes 'format korrekte' XML-dokumenter.