txt saber convertir como codificacion cambiar bom archivos archivo internationalization character-encoding

internationalization - saber - utf 8 sin bom c#



cambiar la codificación del archivo (6)

El problema con UTF-8 es que no existe una secuencia de bytes mágicos al comienzo de estos archivos; la única posibilidad del navegador de detectar UTF-8 es mediante la declaración XML, metaetiquetas HTML o alguna heurística como alternativa.

Asegúrese de que haya una declaración de codificación XML o algunas metaetiquetas HTML en el encabezado del HTML.

<?xml version="1.0" encoding="utf-8"?>

justo debajo de DOCTYPE si es XHTML, o

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

en la sección de la cabeza.

Tengo un problema con la codificación de caracteres en algunas páginas HTML. Parece que la causa del problema es que algunos de los archivos .html no se guardan como archivos codificados en UTF-8. Aunque he ordenado a Eclipse que guarde estos archivos como UTF-8, cuando los abro en un navegador, indica que los archivos son ISO-8859-1.

¿Cómo puedo cambiar la codificación de estos archivos a UTF-8?

ACTUALIZACIÓN: Ya tengo lo siguiente incluido en la sección de cada página web

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

Estoy usando el servidor web Apache.

Gracias, Donal


En Eclipse 3.7, vaya a:

Windows> Preferencias> General> Espacio de trabajo

En "Codificación de archivos de texto", configure la codificación de archivos que necesita.


Es posible que necesite cambiar el encabezado de tipo de contenido que su servidor web envía al cliente.

Editar: Si bien esto funcionó para esta situación en particular, usar una herramienta para cambiar la codificación de archivos como sugieren otros carteles puede ser una mejor solución en otras situaciones. YMMV.

Instrucciones para guardar como UTF-8 en Eclipse (que me doy cuenta que ya tiene):

Probablemente deba cambiar la codificación predeterminada en su espacio de trabajo para el documento HTML.

Esto es para Eclipse 3.4. Si tiene una versión diferente, esto puede ser un poco diferente.

Ir a ventana-> Preferencias
En la ventana Preferencias, vaya a General-> Tipos de contenido
En este punto, puede especificar una ''Codificación predeterminada'' para los archivos cerca de la parte inferior de la ventana de preferencias. Expande ''Texto'' y selecciona HTML. En la entrada ''Codificación predeterminada'', ponga UTF-8. Luego haga clic en ''actualizar'' a la derecha.

Después de esto, todos los archivos HTML deben guardarse en formato UTF-8.


Hasta donde yo sé, configurar la codificación de caracteres en Eclipse no convierte realmente los archivos, simplemente le dice a Eclipse cómo quiere que se interpreten. Su mejor opción es usar una herramienta de conversión como la sugerida por Adam.


Prueba agregar

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

en la sección principal de los archivos html, o asegúrese de que su servidor esté publicando los archivos con un encabezado http Content-Type. Sin ninguno de estos, el navegador solo puede adivinar la codificación de caracteres.


Puede usar iconv para convertir archivos de una codificación de caracteres a otra.