sentiment examples analyze python twitter web-scraping data-mining

python - examples - Twitter: ¿Cómo extraer tweets que contengan símbolos(!,%, $)?



twitter python (3)

Para un proyecto, quiero poder crear un conjunto de datos de tweets que contenga una serie de símbolos en particular. Como también me gustaría ir lo más atrás en el tiempo posible, intenté usar el script GetOldTweets ( https://github.com/Jefferson-Henrique/GetOldTweets-python ) que se menciona aquí: https://stackoverflow.com/a/35077920/5858873 .

El problema es que no puede extraer tweets que contengan símbolos como entrada. De hecho, ni siquiera se puede buscar directamente en Twitter los tweets que contengan los símbolos necesarios.

Para explicar más claramente el problema, considere el siguiente caso de muestra. Me gustaría extraer todos los tweets que contengan la cadena ''!!!'' En los últimos dos años.

¿Cuál es la mejor manera de hacer esto (si esto es factible)?


Encontré este interesante recurso: https://webapps.stackexchange.com/questions/92196/search-for-tweets-with-special-characters

Básicamente dice que ciertos caracteres no se pueden buscar porque Twitter ha bloqueado su uso.

Creo que lo que debes hacer es buscar a través de todos los tweets dentro del rango de cierto alcance , y luego usar el método de cadena que se find en el mensaje del cuerpo de cada tweet. Luego se detendría cuando hubiera alcanzado un cierto tiempo de ejecución o una cantidad específica de tweets encontrados.


Puede crear su propia expresión regular en función de sus requisitos y
Luego pulsa los datos de twitter para extraer los tweets específicos.


Puede descargar y almacenar datos de la API de Twitter utilizando varios criterios (búsqueda de palabras en un diccionario, búsqueda de ubicación, cuentas populares de Twitter, etc.) No será la totalidad de los datos, pero tendrá parte de ellos.

Luego busca estos tweets localmente.

Estos caracteres también son válidos en direcciones URL, así que elimine las direcciones URL antes de buscar.

Además, no olvide verificar si el almacenamiento de datos que obtuvo de Twitter es legal.