tipos tabla ejemplos como codigo codificaciones codificacion codifica caracteres html5 character-encoding

html5 - tabla - como se codifica en unicode



¿HTML5 especifica una codificación de caracteres predeterminada para documentos HTML si no se proporciona una codificación de caracteres? (1)

Falta un documento HTML de ejemplo recuperado a través de HTTP:

  • un encabezado de Content-Type HTTP
  • un HTML <meta charset="<character encoding>" />
  • a HTML <meta http-equiv=''Content-Type'' content=''Type=text/html; charset=<character encoding>''> <meta http-equiv=''Content-Type'' content=''Type=text/html; charset=<character encoding>''>

Con respecto a HTML5, ¿se asume un valor predeterminado, por ejemplo, UTF-8, como la codificación de caracteres? ¿O es completamente la aplicación que lee el documento HTML para elegir un valor predeterminado?


El conjunto de caracteres se determina utilizando estas reglas:

  1. Anulación del usuario.
  2. Un parámetro "conjunto de caracteres" HTTP en un campo "Tipo de contenido".
  3. Una marca de orden de bytes antes de cualquier otro dato en el documento HTML.
  4. Una declaración META con un atributo "charset".
  5. Una declaración META con un atributo "http-equiv" establecido en "Content-Type" y un valor establecido para "charset".
  6. Análisis heurístico no especificado.

...y entonces...

  1. Normalice la cadena de codificación de caracteres dada de acuerdo con las reglas de coincidencia de alias de conjunto de caracteres definidas en el estándar técnico de Unicode # 22.
  2. Anule algunas codificaciones problemáticas, es decir, intente intencionalmente algunas codificaciones como si fueran codificaciones diferentes. La anulación más común es tratar a US-ASCII e ISO-8859-1 como Windows-1252, pero hay otras anulaciones de codificación enumeradas en esta tabla. Como indica la especificación, "El requisito de tratar ciertas codificaciones como otras codificaciones de acuerdo con la tabla anterior es una violación intencional de la especificación del Modelo de caracteres W3C".

Pero lo más importante es:

Siempre debe especificar una codificación de caracteres en cada documento HTML, o sucederán cosas malas . Puede hacerlo de la manera difícil (encabezado HTTP Content-Type), la manera fácil (declaración <meta http-equiv> ), o la nueva forma (atributo <meta charset> ), pero hágalo. La web te agradece.

Fuentes: