www org guide book python beautifulsoup nltk smart-quotes

python - guide - https www nltk org book



¿Cómo me deshago de todas las citas inteligentes al analizar una página web? (1)

Este es mi código:

name = namestr.decode("utf-8") name.replace(u"/u2018", "").replace(u"/u2019", "").replace(u"/u201c","").replace(u"/u201d", "")

Esto no parece funcionar. Todavía encuentro &ldquo , &rdquo etc. en mi texto. También este texto ha sido analizado usando una hermosa sopa


Reemplace la última línea de su código con este:

name = name.replace(u"/u2018", "").replace(u"/u2019", "").replace(u"/u201c","").replace(u"/u201d", "")

El método de replace devuelve una cadena modificada, pero no afecta la picadura en la que lo llama, por lo que debe asignar el valor de retorno a la variable como se indicó anteriormente.