utf8 - unicode escape python
decodificación y codificación de cadena hebrea en Python (1)
Estoy tratando de codificar y decodificar la cadena hebrea "שלום". Sin embargo, después de la codificación, me sale gibberish:
>>> word = "שלום"
>>> word = word.decode(''UTF-8'')
>>> word
u''/u05e9/u05dc/u05d5/u05dd''
>>> print word
שלום
>>> word = word.encode(''UTF-8'')
>>> word
''/xd7/xa9/xd7/x9c/xd7/x95/xd7/x9d''
>>> print word
׳©׳׳•׳
¿Cómo debo hacerlo correctamente?
Gracias.
Tendrá que asegurarse de tener la codificación correcta en su entorno (shell o script). Si está utilizando un script, incluya lo siguiente:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
Para asegurarse de que su entorno sepa que está utilizando UTF-8. Es posible que su terminal shell solo acepte ASCII, así que asegúrese de que sea compatible con UTF-8.
>>> word = "שלום"
>>> word
''/xd7/xa9/xd7/x9c/xd7/x95/xd7/x9d''
>>> print word
שלום
>>> word = word.decode(''UTF-8'')
>>> word
u''/u05e9/u05dc/u05d5/u05dd''
>>> print word
שלום
>>> word = word.encode(''UTF-8'')
>>> word
''/xd7/xa9/xd7/x9c/xd7/x95/xd7/x9d''
>>> print word
שלום
>>>