utf8 escape python python-unicode

utf8 - unicode escape python



decodificación y codificación de cadena hebrea en Python (1)

Estoy tratando de codificar y decodificar la cadena hebrea "שלום". Sin embargo, después de la codificación, me sale gibberish:

>>> word = "שלום" >>> word = word.decode(''UTF-8'') >>> word u''/u05e9/u05dc/u05d5/u05dd'' >>> print word שלום >>> word = word.encode(''UTF-8'') >>> word ''/xd7/xa9/xd7/x9c/xd7/x95/xd7/x9d'' >>> print word ׳©׳׳•׳

¿Cómo debo hacerlo correctamente?

Gracias.


Tendrá que asegurarse de tener la codificación correcta en su entorno (shell o script). Si está utilizando un script, incluya lo siguiente:

#!/usr/bin/env python # -*- coding: utf-8 -*-

Para asegurarse de que su entorno sepa que está utilizando UTF-8. Es posible que su terminal shell solo acepte ASCII, así que asegúrese de que sea compatible con UTF-8.

>>> word = "שלום" >>> word ''/xd7/xa9/xd7/x9c/xd7/x95/xd7/x9d'' >>> print word שלום >>> word = word.decode(''UTF-8'') >>> word u''/u05e9/u05dc/u05d5/u05dd'' >>> print word שלום >>> word = word.encode(''UTF-8'') >>> word ''/xd7/xa9/xd7/x9c/xd7/x95/xd7/x9d'' >>> print word שלום >>>