with read python3 py3 instalar html beautifulsoup pycurl stringio type-conversion

html - read - python modulo io



Convierta io.BytesIO a io.StringIO para analizar la página HTML (1)

Un enfoque ingenuo:

# assume bytes_io is a `BytesIO` object byte_str = bytes_io.read() # Convert to a "unicode" object text_obj = byte_str.decode(''UTF-8'') # Or use the encoding you expect # Use text_obj how you see fit! # io.StringIO(text_obj) will get you to a StringIO object if that''s what you need

Estoy tratando de analizar una página HTML que recuperé a través de pyCurl, pero el pyCurl WRITEFUNCTION está devolviendo la página como BYTES y no como cadena, por lo que no puedo analizarlo usando BeautifulSoup.

¿Hay alguna forma de convertir io.BytesIO a io.StringIO?

¿O hay alguna otra forma de analizar la página HTML?

Estoy usando Python 3.3.2.