Zasady składni XML

Gramatyka XML jest prosta i logiczna. Te zasady są łatwe do nauki i stosowania.

Dokument XML musi mieć element główny

Dokument XML musi zawierać jedenrodzic głównyten element jest rodzicem wszystkich innych elementówrodzic:

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

W tym przykładzie,<note> jest elementem głównym:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Reminder</heading>
  <body>Don't forget the meeting!</body>
</note>

Prolog XML (XML Prolog)

Wiersz ten nazywany jest XML Prolog:

<?xml version="1.0" encoding="UTF-8"?>

Prolog XML jest opcjonalny. Jeśli istnieje, musi znajdować się w pierwszym wierszu dokumentu.

Dokument XML może zawierać międzynarodowe znaki, takie jak norweski øæå lub francuski êèé.

Aby uniknąć błędów, powinieneś określić używaną kodowanie i zapisz plik XML jako UTF-8.

UTF-8 jest domyślnym kodowaniem dokumentów XML.

Możesz znaleźć naszeKursy znakównauka kodowania znaków.

Wskazówka:UTF-8 jest domyślnym kodowaniem dla HTML5, CSS, JavaScript, PHP i SQL.

Wszystkie elementy XML muszą mieć etykiety końcowe

W XML, pomijanie etykiet końcowych jest nielegalne. Wszystkie elementy musząMusiMają etykiety końcowe:

<p>W tym akapicie znajduje się tekst.</p>
<br />

Uwaga:Prolog XML nie ma etykiety końcowej! To nie jest błąd. Prolog nie jest częścią XML. Nie jest to element XML i nie wymaga etykiety końcowej.

Etykiety XML różnicują wielkość liter

Etykiety XML różnicują wielkość liter. Etykieta <Letter> różni się od etykiety <letter>.

Początkowe i końcowe etykiety muszą być używane w tej samej wielkości liter:

<message>Correctne</message>

Komentarz:Otwieranie i zamykanie etykiet nazywane jest etykietami startowymi i końcowymi. Nieważne,哪种术语你喜欢,它们的概念都是相同的。

Elementy XML muszą być poprawnie nawinięte

W HTML, możesz zobaczyć elementy bez poprawnego nawijania:

<b><i>This text is bold and italic</b></i>

W XML, wszystkie elementyMusiPoprawne nawijanie

<b><i>This text is bold and italic</i></b>

W powyższym przykładzie, poprawne wcięcie oznacza, że ponieważ element <i> jest otwarty wewnątrz elementu <b>, musi zostać zamknięty wewnątrz elementu <b>.

Wartości atrybutów XML muszą być w cudzysłowie

Podobnie jak w HTML, XML może mieć atrybuty (para nazwa/wartość).

W XML, wartości atrybutów XML muszą być w cudzysłowie:

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Odniesienia do entyt

W XML niektóre znaki mają specjalne znaczenie.

Jeśli umieścisz znak "<" w elemencie XML, wystąpi błąd, ponieważ parser traktuje go jako początek nowego elementu.

To spowoduje błąd XML:

<message>if salary < 1000 then</message>

Aby uniknąć tego błędu, użyj:Odniesienia do entytaby zastąpić znak "<":

<message>if salary < 1000 then</message>

W XML istnieją 5 zdefiniowanych przez programista odniesień do entyt

< < Mniejszy
> > Większy
& & Ikon
' ' Single quote
" " Cudzysłów

Komentarz:W XML, jedynymi znakami, które są rzeczywiście niedozwolone, są "<" i "&"". Znak ">" jest dopuszczony, ale jest dobrym nawykiem jego użycie zamiast niego.

Komentarze w XML

Gramatyka pisanego w XML komentarza jest bardzo podobna do gramatyki w HTML:

<!-- This is a comment -->

W komentarzu nie można mieć dwóch kresków:

<!-- This is an invalid -- comment -->

W XML zachowywane są białe znaki

HTML redukuje (łączy) wiele połączonych znaków spacji do jednego, w XML, spacje w dokumencie nie są pomijane:

XML:	Hello           George
HTML:	Hello George

XML zapisuje wiersz nowy jako LF

W aplikacjach Windowsowskich, wiersz nowy jest zazwyczaj zapisywany za pomocą pary znaków: znaku odwróconego odwróconego (CR) i znaku nowej linii (LF). Ta para znaków ma podobieństwo do działania ustawiania nowej linii w ustawieniach maszyny do pisania.

Unix i Mac OSX używają LF.

Starsze systemy Mac używają CR.

XML przechowuje nowe wiersze jako LF.

Dobrze zformatowany XML

Dokument XML spełniający powyższe reguły gramatyczne nazywa się „dobrze zformatowanym” dokumentem XML.