python - guide - https www nltk org book
¿Cómo me deshago de todas las citas inteligentes al analizar una página web? (1)
Este es mi código:
name = namestr.decode("utf-8")
name.replace(u"/u2018", "").replace(u"/u2019", "").replace(u"/u201c","").replace(u"/u201d", "")
Esto no parece funcionar. Todavía encuentro &ldquo
, &rdquo
etc. en mi texto. También este texto ha sido analizado usando una hermosa sopa
Reemplace la última línea de su código con este:
name = name.replace(u"/u2018", "").replace(u"/u2019", "").replace(u"/u201c","").replace(u"/u201d", "")
El método de replace
devuelve una cadena modificada, pero no afecta la picadura en la que lo llama, por lo que debe asignar el valor de retorno a la variable como se indicó anteriormente.