encoding - simbolos - ¿Los archivos de texto cargados en S3 están codificados de manera extraña?
detectar codificacion online (3)
Este es el error más extraño, y ni siquiera sé por dónde empezar a entender lo que está mal.
S3 ha estado funcionando bien, hasta que un día (ayer) extrañamente codifica cualquier archivo de texto cargado a caracteres extraños. Cada vez que un archivo de texto tiene Å, Ä, Ö o cualquier otro UTF-8 comparable pero no tiene caracteres en inglés, el archivo de texto está en mal estado. Intenté cargar utilizando varios clientes, así como la interfaz web de AWS. La carga va bien, luego descargo el archivo y está en mal estado. Intenté descargarlo en mi Mac, intenté descargarlo en una Raspberry con Linux. Mismo error.
¿Hay alguna codificación hecha por los servidores Amazons S3?
Si sus datos incluyen non-ASCII multibyte characters (such as Chinese or Cyrillic characters)
, debe cargar los datos en columnas VARCHAR
. El tipo de datos VARCHAR
admite caracteres UTF-8 de cuatro bytes, pero el tipo de datos CHAR
solo acepta caracteres ASCII de un solo byte.
Fuente: http://docs.aws.amazon.com/redshift/latest/dg/t_loading_unicode_data.html
Puede establecer explícitamente "Content-Type: text / plain; charset = utf-8", en el archivo en la consola S3.
Esto le dirá a S3 que sirva de texto.
No estoy seguro por qué, pero la respuesta de Sony Kadavan no funcionó en mi caso.
Más bien que:
Content-Type: text / plain; charset = utf-8
Solía:
Content-Type: text / html; charset = utf-8
Lo cual pareció funcionar.