html - read - python modulo io
Convierta io.BytesIO a io.StringIO para analizar la página HTML (1)
Un enfoque ingenuo:
# assume bytes_io is a `BytesIO` object
byte_str = bytes_io.read()
# Convert to a "unicode" object
text_obj = byte_str.decode(''UTF-8'') # Or use the encoding you expect
# Use text_obj how you see fit!
# io.StringIO(text_obj) will get you to a StringIO object if that''s what you need
Estoy tratando de analizar una página HTML que recuperé a través de pyCurl, pero el pyCurl WRITEFUNCTION está devolviendo la página como BYTES y no como cadena, por lo que no puedo analizarlo usando BeautifulSoup.
¿Hay alguna forma de convertir io.BytesIO a io.StringIO?
¿O hay alguna otra forma de analizar la página HTML?
Estoy usando Python 3.3.2.