Règles de syntaxe XML

Les règles de syntaxe de XML sont simples et logiques. Ces règles sont faciles à apprendre et à utiliser.

Un document XML doit avoir un élément racine

Un document XML doit contenir unÉlément racinequi est l'élément de tous les autres élémentsÉlément parent:

<root>
  <enfant>
    <sous-enfant>.....</sous-enfant>
  </enfant>
</root>

Dans cet exemple,<note> est l'élément racine :

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Rappel</heading>
  <body>N'oubliez pas la réunion !</body>
</note>

Préambule XML (XML Prolog)

Cette ligne est appelée ligne XML Préambule:

<?xml version="1.0" encoding="UTF-8"?>

Le préambule XML est optionnel. S'il existe, il doit être situé sur la première ligne du document.

Les documents XML peuvent contenir des caractères internationaux, par exemple norvégien øæå ou français êèé.

Pour éviter les erreurs, vous devriez spécifier l'encodage utilisé et enregistrer le fichier XML en UTF-8.

UTF-8 est le codage par défaut des documents XML.

Vous pouvez trouver dans nosTutoriel sur les jeux de caractèresétudier les encodages de caractères.

Astuce :UTF-8 est le codage par défaut de HTML5, CSS, JavaScript, PHP et SQL.

Tous les éléments XML doivent avoir une étiquette de fin

En XML, l'omission de la balise de fin est illégale. Tous les éléments doiventDans XML, tous les élémentsIl y a une étiquette de fin :

<p>Ceci est un paragraphe.</p>
<br />

Attention :La préambule XML n'a pas d'étiquette de fin ! Ce n'est pas une erreur. Le préambule ne fait pas partie intégrante de XML. Il n'est pas un élément XML et n'a pas besoin d'étiquette de fermeture.

Les étiquettes XML sont sensibles à la casse

Les étiquettes XML sont sensibles à la casse. L'étiquette <Letter> est différente de l'étiquette <letter>.

Les étiquettes de début et de fin doivent utiliser la même casse :

<message>C'est correct</message>

Commentaire :Ouvrir et fermer une étiquette est généralement appelé étiquette de début et étiquette de fin. Peu importe le terme que vous préférez, le concept est le même.

XML 元素必须正确嵌套

Les éléments XML doivent être implantés correctement

Dans HTML, vous pourriez voir des éléments sans implantation correcte :

<b><i>This text is bold and italic</b></i>Dans XML, tous les élémentsDoit

Implantation correcte mutuelle :

<b><i>This text is bold and italic</i></b>

Dans l'exemple précédent, la bonne implantation signifie que, puisqu'un élément <i> est ouvert à l'intérieur d'un élément <b>, il doit être fermé à l'intérieur de l'élément <b>.

Les valeurs des attributs XML doivent être entourées de guillemets

De la même manière que HTML, XML peut également posséder des attributs (paires de nom/valeur).

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Référence d'entité

Dans XML, certains caractères ont un sens spécial.

Si vous placez le caractère "<" dans un élément XML, cela produira une erreur, car l'analyseur le considère comme le début d'un nouvel élément.

Cela produira une erreur XML :

<message>if salary < 1000 then</message>

Pour éviter cette erreur, utilisezRéférence d'entitéà la place du caractère "<" :

<message>if salary < 1000 then</message>

Dans XML, il y a 5 entités prédéfinies :

< < Petit
> > Grand
& & Et
' ' Single quote
" " Guillemets

Commentaire :Dans XML, seuls les caractères "<" et """ sont effectivement illicites. > est légal, mais l'utilisation de > à la place est une bonne habitude.

Commentaires dans XML

La syntaxe de la notation des commentaires dans XML est très similaire à celle de HTML :

<!-- This is a comment -->

Il n'est pas permis d'avoir deux tirets douloureux consécutifs dans le commentaire :

<!-- This is an invalid -- comment -->

XML conserve les espaces blancs

HTML raccourcit plusieurs espaces blancs consécutifs en un seul, tandis que dans XML, les espaces dans le document ne sont pas supprimés :

XML:  Bonjour           George
HTML:  Bonjour George

XML stocke le saut de ligne en LF

Dans les applications Windows, le saut de ligne est généralement stocké par un couple de caractères : le retour chariot (CR) et le saut de ligne (LF). Ces caractères sont similaires à l'action de la mise en page d'une nouvelle ligne sur une machine à écrire.

Unix et Mac OSX utilisent LF.

Les anciens systèmes Mac utilisent CR.

XML stocke les nouvelles lignes sous forme de LF.

XML correctement formé

Un document XML conforme à la grammaire ci-dessus est appelé un document XML 'correctement formé'.