Syntaxregeln von XML
- Ein XML-Dokument, das den obigen Grammatikregeln entspricht, wird als "gut formatiertes" XML-Dokument bezeichnet. Baumstruktur von XML
- Vorherige Seite XML-Elemente
Die Syntaxregeln von XML sind einfach und logisch. Diese Regeln sind leicht zu lernen und zu verwenden.
Ein XML-Dokument muss ein Wurzelelement haben
Ein XML-Dokument muss einWurzelelementist der Elternteil aller anderen ElementeElternelement:
<root> <child> <subchild>.....</subchild> </child> </root>
In diesem Beispiel,<note>
ist der Wurzelelement:
<?xml version="1.0" encoding="UTF-8"?> <note> <to>George</to> <from>John</from> <heading>Reminder</heading> <body>Don't forget the meeting!</body> </note>
XML-Prolog (XML-Prolog)
Diese Zeile wird als XML Prolog:
<?xml version="1.0" encoding="UTF-8"?>
Der XML-Prolog ist optional. Wenn er vorhanden ist, muss er in der ersten Zeile des Dokuments stehen.
XML-Dokumente können internationale Zeichen enthalten, z.B. norwegische øæå oder französische êèé.
Um Fehler zu vermeiden, sollten Sie die verwendete Kodierung angeben und die XML-Datei als UTF-8 speichern.
UTF-8 ist die Standardzeichensatzkodierung für XML-Dokumente.
Sie können in unseremZeichensatz-TutorialLernen Sie hier die Zeichencodierung.
Tipp:UTF-8 ist die Standardkodierung für HTML5, CSS, JavaScript, PHP und SQL.
Alle XML-Elemente müssen End-Tags haben
In XML ist das Auslassen von End-Tags illegal. Alle Elemente müssenMussmit Schließungstag:
<p>This is a paragraph.</p> <br />
Achtung:XML-Prolog hat keine End-Tags! Dies ist kein Fehler. Der Prolog gehört nicht zum eigentlichen Bestandteil von XML. Es ist kein XML-Element und bedarf keiner Schließung.
XML-Tags unterscheiden zwischen Groß- und Kleinschreibung
XML-Tags unterscheiden zwischen Groß- und Kleinschreibung. Das Tag <Letter> ist vom Tag <letter> unterschiedlich.
Start- und End-Tags müssen in gleicher Groß-/Kleinschreibung verwendet werden:
<message>This is correct</message>
Kommentar:Öffnen und Schließen von Tags wird in der Regel als Start- und End-Tags bezeichnet. Egal, welche Bezeichnung Sie bevorzugen, der Begriff ist derselbe.
XML-Elemente müssen korrekt geschachtelt sein
In HTML könnten Sie möglicherweise Elemente sehen, die nicht korrekt geschachtelt sind:
<b><i>This text is bold and italic</b></i>
In XML müssen alle ElementeMussKorrekt ineinander geschachtelt:
<b><i>This text is bold and italic</i></b>
Im obigen Beispiel bedeutet die korrekte Einrückung: Da das <i>-Element innerhalb des <b>-Elements geöffnet ist, muss es auch innerhalb des <b>-Elements geschlossen werden.
XML-Attributwerte müssen in Anführungszeichen gesetzt werden
Wie in HTML auch, kann XML Attribute (Name/Wert-Paare) haben.
Wie in HTML auch, müssen die Attributwerte in XML in Anführungszeichen gesetzt werden:
<note date="12/11/2007"> <to>George</to> <from>John</from> </note>
Entity-Referenzen
Einige Zeichen haben in XML eine spezielle Bedeutung.
Wenn Sie das Zeichen "<" in einem XML-Element platzieren, tritt ein Fehler auf, da der Parser es als den Beginn eines neuen Elements interpretiert.
Dies würde einen XML-Fehler verursachen:
<message>if salary < 1000 then</message>
Um diesen Fehler zu vermeiden, verwenden SieEntity-Referenzenum das Zeichen "<" zu ersetzen:
<message>if salary < 1000 then</message>
In XML gibt es 5 vorgegebene Entity-Referenzen:
< | < | Kleiner als |
> | > | Größer als |
& | & | Und-Zeichen |
' | ' | Einfaches Anführungszeichen |
" | " | Anführungszeichen |
Kommentar:In XML sind nur die Zeichen "<" und "&"" tatsächlich illegal. ">" ist legal, aber es ist eine gute Gewohnheit, es durch ">" zu ersetzen.
XML-Kommentare
Die Syntax für die Kommentierung in XML ist sehr ähnlich zu der in HTML:
<!-- Dies ist ein Kommentar -->
Zwischen Kommentaren sind zwei Bindestriche nicht erlaubt:
<!-- Dies ist ein ungültiger -- Kommentar -->
XML behält Leerzeichen bei
HTML reduziert mehrere aufeinanderfolgende Leerzeichen auf ein einziges, in XML werden Leerzeichen im Dokument nicht gekürzt:
XML: Hello George HTML: Hello George
XML speichert Zeilenumbrüche als LF
In Windows-Anwendungen wird der Zeilenumbruch in der Regel durch ein Paar Zeichen gespeichert: den Return-Zeichen (CR) und den Zeilenumbruch (LF). Diese Zeichenpaare haben eine Ähnlichkeit mit der Aktion, eine neue Zeile in einer Schreibmaschine zu setzen.
Unix 和 Mac OSX 使用 LF。
Unix und Mac OSX verwenden LF.
Alte Mac-Systeme verwenden CR.
XML speichert Zeilenenden als LF.
Gut formatiertes XML
- Ein XML-Dokument, das den obigen Grammatikregeln entspricht, wird als "gut formatiertes" XML-Dokument bezeichnet. Baumstruktur von XML
- Vorherige Seite XML-Elemente