css - force - utf-8 encoding
ISO-8859-1 vs UTF-8? (5)
Encuentro iso-8859-1 muy útil en un par de sitios donde tengo clientes que me envían archivos de texto creados en Word o Publisher, que puedo insertar fácilmente en medio del código PHP y no preocuparme por ello, especialmente cuando las citas están preocupados. Estas son compañías locales de EE. UU., Literalmente, no hay otra diferencia en el texto de las páginas, y no veo ninguna desventaja en el uso de ese conjunto de caracteres en esas páginas en particular. Todos los demás son UTF-8.
¿Qué se debe usar y cuándo? ¿o siempre es mejor usar UTF-8 siempre? o ISO-8859-1 todavía tiene importancia en condiciones específicas?
¿El conjunto de caracteres está relacionado con la región geográfica?
Editar:
¿Hay algún beneficio para poner este código @charset "utf-8";
o como este <link type="text/css; charset=utf-8" rel="stylesheet" href=".." />
en la parte superior del archivo CSS?
Encontré esto
Si DreamWeaver agrega la etiqueta cuando agrega estilo incrustado al documento, eso es un error en DreamWeaver. De las preguntas frecuentes del W3C:
"Para las declaraciones de estilo incrustadas en un documento, las reglas @charset no son necesarias y no deben utilizarse".
La especificación del juego de caracteres es una parte de CSS desde la versión 2.0 (mayo de 1998), por lo que si tiene una especificación de juego de caracteres en un archivo CSS y Safari no puede manejarlo, eso es un error en Safari.
y agregue accept-charset en forma
<form action="/action" method="post" accept-charset="utf-8">
y lo que debería usarse si uso xhtml doctype
<?xml version="1.0" encoding="UTF-8"?>
o
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
UTF-8 es compatible en todas partes en la web. Solo en aplicaciones específicas, no lo es. Siempre debes usar utf-8 si puedes.
La desventaja es que para idiomas como el chino, utf-8 toma más espacio que, por ejemplo, utf-16. Pero si no planea ir a China, o incluso si va a China, utf-8 está bien.
Las únicas desventajas contra el uso de utf-8 es que se necesita más espacio en comparación con varias codificaciones, pero en comparación con los idiomas occidentales, no requiere casi ningún espacio adicional, excepto para caracteres muy especiales y esos bytes adicionales con los que puede convivir. Estamos en 2009 después de todo. ;)
Unicode se está haciendo cargo y ya ha superado a todos los demás. Te sugiero que te subas al tren ahora mismo.
Tenga en cuenta que hay varios sabores de Unicode. Joel Spolsky da una visión general .
(Gráfico actual a partir de febrero de 2012 , vea el comentario a continuación para obtener valores más exactos).
ISO-8859-1 es una gran codificación para usar cuando el espacio es una prioridad y solo querrá codificar caracteres de los idiomas latinos básicos que admite. Y nunca jamás tendrás que pensar en actualizar tu aplicación para que sea compatible con idiomas que no sean latinos.
utf8 es una manera fantástica de (a) utilizar la gran base de código de 8bits por bibliotecas de códigos de caracteres que ya existen, o (b) ser un snob del euro. utf8 codifica Ascii estándar en 1 byte por carácter, Latin 1 en 2 bytes por carácter, los idiomas de Europa del Este y Asia obtienen 3 bytes por carácter. Posiblemente llegue a 4 bytes por carácter si intentas codificar idiomas antiguos que no existen en el plano multilingüe básico.
utf16 es una excelente manera de comenzar una nueva base de código desde cero. Es completamente culturalmente neutral. Todo el mundo recibe 2 bytes por personaje. Necesita 4 bytes por carácter para idiomas antiguos / exóticos, lo que significa que, en el peor de los casos, es tan malo como su hermano mayor:
utf32 es una pérdida de espacio.