Règles de syntaxe XML
- Page précédente Structure arborescente XML
- Page suivante Éléments XML
Les règles de syntaxe de XML sont simples et logiques. Ces règles sont faciles à apprendre et à utiliser.
Un document XML doit avoir un élément racine
Un document XML doit contenir unÉlément racinequi est l'élément de tous les autres élémentsÉlément parent:
<root> <enfant> <sous-enfant>.....</sous-enfant> </enfant> </root>
Dans cet exemple,<note>
est l'élément racine :
<?xml version="1.0" encoding="UTF-8"?> <note> <to>George</to> <from>John</from> <heading>Rappel</heading> <body>N'oubliez pas la réunion !</body> </note>
Préambule XML (XML Prolog)
Cette ligne est appelée ligne XML Préambule:
<?xml version="1.0" encoding="UTF-8"?>
Le préambule XML est optionnel. S'il existe, il doit être situé sur la première ligne du document.
Les documents XML peuvent contenir des caractères internationaux, par exemple norvégien øæå ou français êèé.
Pour éviter les erreurs, vous devriez spécifier l'encodage utilisé et enregistrer le fichier XML en UTF-8.
UTF-8 est le codage par défaut des documents XML.
Vous pouvez trouver dans nosTutoriel sur les jeux de caractèresétudier les encodages de caractères.
Astuce :UTF-8 est le codage par défaut de HTML5, CSS, JavaScript, PHP et SQL.
Tous les éléments XML doivent avoir une étiquette de fin
En XML, l'omission de la balise de fin est illégale. Tous les éléments doiventDans XML, tous les élémentsIl y a une étiquette de fin :
<p>Ceci est un paragraphe.</p> <br />
Attention :La préambule XML n'a pas d'étiquette de fin ! Ce n'est pas une erreur. Le préambule ne fait pas partie intégrante de XML. Il n'est pas un élément XML et n'a pas besoin d'étiquette de fermeture.
Les étiquettes XML sont sensibles à la casse
Les étiquettes XML sont sensibles à la casse. L'étiquette <Letter> est différente de l'étiquette <letter>.
Les étiquettes de début et de fin doivent utiliser la même casse :
<message>C'est correct</message>
Commentaire :Ouvrir et fermer une étiquette est généralement appelé étiquette de début et étiquette de fin. Peu importe le terme que vous préférez, le concept est le même.
XML 元素必须正确嵌套
Les éléments XML doivent être implantés correctement
Dans HTML, vous pourriez voir des éléments sans implantation correcte :
<b><i>This text is bold and italic</b></i>Dans XML, tous les élémentsDoit
Implantation correcte mutuelle :
<b><i>This text is bold and italic</i></b>
Dans l'exemple précédent, la bonne implantation signifie que, puisqu'un élément <i> est ouvert à l'intérieur d'un élément <b>, il doit être fermé à l'intérieur de l'élément <b>.
Les valeurs des attributs XML doivent être entourées de guillemets
De la même manière que HTML, XML peut également posséder des attributs (paires de nom/valeur).
<note date="12/11/2007"> <to>George</to> <from>John</from> </note>
Référence d'entité
Dans XML, certains caractères ont un sens spécial.
Si vous placez le caractère "<" dans un élément XML, cela produira une erreur, car l'analyseur le considère comme le début d'un nouvel élément.
Cela produira une erreur XML :
<message>if salary < 1000 then</message>
Pour éviter cette erreur, utilisezRéférence d'entitéà la place du caractère "<" :
<message>if salary < 1000 then</message>
Dans XML, il y a 5 entités prédéfinies :
< | < | Petit |
> | > | Grand |
& | & | Et |
' | ' | Single quote |
" | " | Guillemets |
Commentaire :Dans XML, seuls les caractères "<" et """ sont effectivement illicites. > est légal, mais l'utilisation de > à la place est une bonne habitude.
Commentaires dans XML
La syntaxe de la notation des commentaires dans XML est très similaire à celle de HTML :
<!-- This is a comment -->
Il n'est pas permis d'avoir deux tirets douloureux consécutifs dans le commentaire :
<!-- This is an invalid -- comment -->
XML conserve les espaces blancs
HTML raccourcit plusieurs espaces blancs consécutifs en un seul, tandis que dans XML, les espaces dans le document ne sont pas supprimés :
XML: Bonjour George HTML: Bonjour George
XML stocke le saut de ligne en LF
Dans les applications Windows, le saut de ligne est généralement stocké par un couple de caractères : le retour chariot (CR) et le saut de ligne (LF). Ces caractères sont similaires à l'action de la mise en page d'une nouvelle ligne sur une machine à écrire.
Unix et Mac OSX utilisent LF.
Les anciens systèmes Mac utilisent CR.
XML stocke les nouvelles lignes sous forme de LF.
XML correctement formé
Un document XML conforme à la grammaire ci-dessus est appelé un document XML 'correctement formé'.
- Page précédente Structure arborescente XML
- Page suivante Éléments XML