Syntaxregeln von XML

  • Ein XML-Dokument, das den obigen Grammatikregeln entspricht, wird als "gut formatiertes" XML-Dokument bezeichnet. Baumstruktur von XML
  • Vorherige Seite XML-Elemente

Die Syntaxregeln von XML sind einfach und logisch. Diese Regeln sind leicht zu lernen und zu verwenden.

Ein XML-Dokument muss ein Wurzelelement haben

Ein XML-Dokument muss einWurzelelementist der Elternteil aller anderen ElementeElternelement:

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

In diesem Beispiel,<note> ist der Wurzelelement:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Reminder</heading>
  <body>Don't forget the meeting!</body>
</note>

XML-Prolog (XML-Prolog)

Diese Zeile wird als XML Prolog:

<?xml version="1.0" encoding="UTF-8"?>

Der XML-Prolog ist optional. Wenn er vorhanden ist, muss er in der ersten Zeile des Dokuments stehen.

XML-Dokumente können internationale Zeichen enthalten, z.B. norwegische øæå oder französische êèé.

Um Fehler zu vermeiden, sollten Sie die verwendete Kodierung angeben und die XML-Datei als UTF-8 speichern.

UTF-8 ist die Standardzeichensatzkodierung für XML-Dokumente.

Sie können in unseremZeichensatz-TutorialLernen Sie hier die Zeichencodierung.

Tipp:UTF-8 ist die Standardkodierung für HTML5, CSS, JavaScript, PHP und SQL.

Alle XML-Elemente müssen End-Tags haben

In XML ist das Auslassen von End-Tags illegal. Alle Elemente müssenMussmit Schließungstag:

<p>This is a paragraph.</p>
<br />

Achtung:XML-Prolog hat keine End-Tags! Dies ist kein Fehler. Der Prolog gehört nicht zum eigentlichen Bestandteil von XML. Es ist kein XML-Element und bedarf keiner Schließung.

XML-Tags unterscheiden zwischen Groß- und Kleinschreibung

XML-Tags unterscheiden zwischen Groß- und Kleinschreibung. Das Tag <Letter> ist vom Tag <letter> unterschiedlich.

Start- und End-Tags müssen in gleicher Groß-/Kleinschreibung verwendet werden:

<message>This is correct</message>

Kommentar:Öffnen und Schließen von Tags wird in der Regel als Start- und End-Tags bezeichnet. Egal, welche Bezeichnung Sie bevorzugen, der Begriff ist derselbe.

XML-Elemente müssen korrekt geschachtelt sein

In HTML könnten Sie möglicherweise Elemente sehen, die nicht korrekt geschachtelt sind:

<b><i>This text is bold and italic</b></i>

In XML müssen alle ElementeMussKorrekt ineinander geschachtelt:

<b><i>This text is bold and italic</i></b>

Im obigen Beispiel bedeutet die korrekte Einrückung: Da das <i>-Element innerhalb des <b>-Elements geöffnet ist, muss es auch innerhalb des <b>-Elements geschlossen werden.

XML-Attributwerte müssen in Anführungszeichen gesetzt werden

Wie in HTML auch, kann XML Attribute (Name/Wert-Paare) haben.

Wie in HTML auch, müssen die Attributwerte in XML in Anführungszeichen gesetzt werden:

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Entity-Referenzen

Einige Zeichen haben in XML eine spezielle Bedeutung.

Wenn Sie das Zeichen "<" in einem XML-Element platzieren, tritt ein Fehler auf, da der Parser es als den Beginn eines neuen Elements interpretiert.

Dies würde einen XML-Fehler verursachen:

<message>if salary < 1000 then</message>

Um diesen Fehler zu vermeiden, verwenden SieEntity-Referenzenum das Zeichen "<" zu ersetzen:

<message>if salary < 1000 then</message>

In XML gibt es 5 vorgegebene Entity-Referenzen:

< < Kleiner als
> > Größer als
& & Und-Zeichen
' ' Einfaches Anführungszeichen
" " Anführungszeichen

Kommentar:In XML sind nur die Zeichen "<" und "&"" tatsächlich illegal. ">" ist legal, aber es ist eine gute Gewohnheit, es durch ">" zu ersetzen.

XML-Kommentare

Die Syntax für die Kommentierung in XML ist sehr ähnlich zu der in HTML:

<!-- Dies ist ein Kommentar -->

Zwischen Kommentaren sind zwei Bindestriche nicht erlaubt:

<!-- Dies ist ein ungültiger -- Kommentar -->

XML behält Leerzeichen bei

HTML reduziert mehrere aufeinanderfolgende Leerzeichen auf ein einziges, in XML werden Leerzeichen im Dokument nicht gekürzt:

XML:	Hello           George
HTML:	Hello George

XML speichert Zeilenumbrüche als LF

In Windows-Anwendungen wird der Zeilenumbruch in der Regel durch ein Paar Zeichen gespeichert: den Return-Zeichen (CR) und den Zeilenumbruch (LF). Diese Zeichenpaare haben eine Ähnlichkeit mit der Aktion, eine neue Zeile in einer Schreibmaschine zu setzen.

Unix 和 Mac OSX 使用 LF。

Unix und Mac OSX verwenden LF.

Alte Mac-Systeme verwenden CR.

XML speichert Zeilenenden als LF.

Gut formatiertes XML

  • Ein XML-Dokument, das den obigen Grammatikregeln entspricht, wird als "gut formatiertes" XML-Dokument bezeichnet. Baumstruktur von XML
  • Vorherige Seite XML-Elemente