Reglas de sintaxis XML

Las reglas de sintaxis de XML son muy simples y lógicas. Estas reglas son fáciles de aprender y de usar.

El documento XML debe tener un elemento raíz

El documento XML debe contener unElemento raíz, este elemento es el padre de todos los otros elementosElemento padre:

<raíz>
  <hijo>
    <subhijo>.....</subhijo>
  </hijo>
</raíz>

En este ejemplo,<nota> es el elemento raíz:

<?xml version="1.0" encoding="UTF-8"?>
<nota>
  <to>George</to>
  <from>John</from>
  <heading>Recordatorio</heading>
  <body>No olvide la reunión!</body>
</note>

Secuencia de la declaración XML (XML Prolog)

Esta línea se llama secuencia XML Secuencia:

<?xml version="1.0" encoding="UTF-8"?>

La secuencia de la declaración XML es opcional. Si existe, debe estar ubicada en la primera línea del documento.

Los documentos XML pueden contener caracteres internacionales, como el noruego øæå o el francés êèé.

Para evitar errores, debe especificar la codificación utilizada y guardar el archivo XML como UTF-8.

UTF-8 es la codificación de caracteres predeterminada de los documentos XML.

Puede encontrar en nuestrosTutoriales de conjunto de caracterespara aprender sobre codificación de caracteres.

Consejo:UTF-8 también es la codificación predeterminada de HTML5, CSS, JavaScript, PHP y SQL.

Todos los elementos XML deben tener etiqueta de finalización

En XML, omitir la etiqueta de finalización es ilegal. Todos los elementos debenEn XML, todos los elementosTiene etiqueta de finalización:

<p>Este es un párrafo.</p>
<br />

Atención:¡La secuencia de la declaración XML no tiene etiqueta de finalización! Esto no es un error. La declaración no forma parte de los componentes propios de XML. No es un elemento XML y no requiere etiqueta de cierre.

Las etiquetas XML distinguen entre mayúsculas y minúsculas

Las etiquetas XML distinguen entre mayúsculas y minúsculas. La etiqueta <Letter> es diferente de la etiqueta <letter>.

Las etiquetas de inicio y finalización deben usar mayúsculas y minúsculas idénticas:

<message>Esto es correcto</message>

Comentarios:El abrir y cerrar etiquetas se conoce generalmente como etiquetas de inicio y etiquetas de finalización. Independientemente de cuál prefiera el término, su concepto es el mismo.

XML 元素必须正确嵌套

Los elementos XML deben estar correctamente nesting

En HTML, es posible que vea elementos sin nesting correcto:

<b><i>Este texto es negrita y cursiva</b></i>En XML, todos los elementosDebe

Nesting correcto e interrelacionado:

<b><i>Este texto es negrita y cursiva</i></b>

En el ejemplo anterior, el significado correcto de la nesting es: dado que el elemento <i> se abre dentro del elemento <b>, debe cerrarse dentro del elemento <b>.

Los valores de atributo de XML deben estar entre comillas

Al igual que HTML, XML también puede tener atributos (pares de nombre/valor).

<note date="12/11/2007">
  <to>George</to>
  <from>John</from>
</note>

Referencias de entidades

En XML, algunos caracteres tienen un significado especial.

Si coloca el carácter "<" dentro de un elemento XML, se producirá un error, ya que el analizador lo interpretará como el inicio de un nuevo elemento.

Esto producirá un error de XML:

<message>if salary < 1000 then</message>

Para evitar este error, utiliceReferencias de entidadespara reemplazar el carácter "<"

<message>if salary < 1000 then</message>

En XML, hay 5 referencias de entidades predefinidas:

< < Menor que
> > Mayor que
& & Y
' ' Comillas simples
" " Comillas

Comentarios:En XML, solo los caracteres "<" y "&"" son ilegales. > es legal, pero es una buena costumbre reemplazarlo con >.

Comentarios en XML

La sintaxis de escritura de comentarios en XML es muy similar a la de HTML:

<!-- Esto es un comentario -->

No se permite que haya dos guiones rectos en el medio de un comentario:

<!-- Esto es un comentario no válido -->

XML preserva los espacios en blanco

HTML recortará (combinará) múltiples espacios en blanco consecutivos en uno solo, en XML, los espacios en blanco del documento no se eliminarán:

XML: ¡Hola              George!
HTML: ¡Hola George!

XML almacena el salto de línea como LF

En los programas de aplicaciones de Windows, el salto de línea se almacena generalmente con un par de caracteres: el carácter de retorno de carro (CR) y el carácter de nueva línea (LF). Este par de caracteres tiene una semejanza con la acción de comenzar una nueva línea en una máquina de escribir.

Unix y Mac OSX usan LF.

Los sistemas Mac antiguos usan CR.

XML almacena las nuevas líneas como LF.

XML bien formado

Los documentos XML que cumplen con las reglas de gramática se denominan documentos XML 'bien formados'.