utf8 open python string unicode encoding unicode-literals

open - string to unicode python



¿Cómo decodificar literales sin procesar unicode a una cadena legible? (2)

Si asigno literales en bruto unicode a una variable, puedo leer su valor:

>>> s = u''/u0421/u043e/u043e/u0431/u0449/u0435/u043d/u0438/u0435 /u043e/u0442/u043f/u0440/u0430/u0432/u043b/u0435/u043d/u043e'' >>> s u''/u0421/u043e/u043e/u0431/u0449/u0435/u043d/u0438/u0435 /u043e/u0442/u043f/u0440/u0430/u0432/u043b/u0435/u043d/u043e'' >>> print s Сообщение отправлено

Pero cuando ya he asignado valor a una cadena simple, no unicode, no puedo:

>>> s = ''/u0421/u043e/u043e/u0431/u0449/u0435/u043d/u0438/u0435 /u043e/u0442/u043f/u0440/u0430/u0432/u043b/u0435/u043d/u043e'' >>> s ''//u0421//u043e//u043e//u0431//u0449//u0435//u043d//u0438//u0435 //u043e//u0442//u043f//u0440//u0430//u0432//u043b//u0435//u043d//u043e'' >>> print s /u0421/u043e/u043e/u0431/u0449/u0435/u043d/u0438/u0435 /u043e/u0442/u043f/u0440/u0430/u0432/u043b/u0435/u043d/u043e

¿Cómo puedo decodificarlo y leerlo?


Si obtiene resultados extraños al decodificar intente seguir

print repr(s).decode(''unicode-escape'').encode(''latin-1'') // or encode using some other encoding

Podría ser que la terminal de Python está usando ASCII por defecto y hay un símbolo que está fuera de rango.