XML: entidades de caracteres
Este capítulo describe el XML Character Entities. Antes de comprender las entidades de caracteres, primero comprendamos qué es una entidad XML.
Según lo expresado por W3 Consortium, la definición de entidad es la siguiente:
"La entidad del documento sirve como la raíz del árbol de la entidad y un punto de partida para un procesador XML".
Esto significa que las entidades son los marcadores de posición en XML. Estos se pueden declarar en el prólogo del documento o en un DTD. Hay diferentes tipos de entidades y en este capítulo discutiremos la Entidad de personaje.
Tanto HTML como XML, tienen algunos símbolos reservados para su uso, que no pueden usarse como contenido en código XML. Por ejemplo,< y >los signos se utilizan para abrir y cerrar etiquetas XML. Para mostrar estos caracteres especiales, se utilizan las entidades de caracteres.
Hay algunos caracteres especiales o símbolos que no están disponibles para ser escritos directamente desde el teclado. Las entidades de caracteres también se pueden utilizar para mostrar esos símbolos / caracteres especiales.
Tipos de entidades de carácter
Hay tres tipos de entidades de carácter:
- Entidades de carácter predefinidas
- Entidades de caracteres numeradas
- Entidades de carácter con nombre
Entidades de carácter predefinidas
Se introducen para evitar la ambigüedad al usar algunos símbolos. Por ejemplo, se observa una ambigüedad cuando menos de (< ) o mayor que ( > ) El símbolo se utiliza con la etiqueta de ángulo (<>). Las entidades de caracteres se utilizan básicamente para delimitar etiquetas en XML. A continuación se muestra una lista de entidades de caracteres predefinidas a partir de la especificación XML. Estos se pueden utilizar para expresar caracteres sin ambigüedad.
Ampersand - &
Comilla simple - '
Mayor que - >
Menos de - <
Comillas dobles - "
Entidades de caracteres numéricos
La referencia numérica se utiliza para referirse a una entidad de carácter. La referencia numérica puede estar en formato decimal o hexadecimal. Como hay miles de referencias numéricas disponibles, son un poco difíciles de recordar. La referencia numérica se refiere al carácter por su número en el juego de caracteres Unicode.
La sintaxis general para la referencia numérica decimal es -
&# decimal number ;
La sintaxis general para la referencia numérica hexadecimal es -
&#x Hexadecimal number ;
La siguiente tabla enumera algunas entidades de caracteres predefinidas con sus valores numéricos:
Nombre de la entidad | Personaje | Referencia decimal | Referencia hexadecimal |
---|---|---|---|
cotización | " | & # 34; | & # x22; |
amperio | Y | & # 38; | & # x26; |
apos | ' | & # 39; | & # x27; |
es | < | & # 60; | & # x3C; |
gt | > | & # 62; | & # x3E; |
Entidad de personaje con nombre
Como es difícil recordar los caracteres numéricos, el tipo de entidad de carácter más preferido es la entidad de carácter con nombre. Aquí, cada entidad se identifica con un nombre.
Por ejemplo
'Agudo' representa carácter mayúsculo con acento agudo.
'ugrave' representa al pequeño con acento grave.