sintactica - NLP clasifica oraciones/párrafos como divertidos
clasificacion de las oraciones (5)
¿Hay alguna manera de clasificar una oración / párrafo en particular como gracioso? Hay muy pocos indicadores sobre dónde se debe ir más allá en esto.
Hay investigaciones sobre esto, se llama Humor computacional . Es un área interdisciplinaria que toma elementos de la lingüística computacional, la psicolingüística, la inteligencia artificial, el aprendizaje automático, etc. Están tratando de descubrir qué es lo que hace que las historias o bromas sean divertidas (por ejemplo, la conexión inesperada o el uso de un tema tabú de una manera sorprendente etc.) y aplicarlo al texto (ya sea para generar una historia divertida o para medir el "sentido del humor" del texto).
Hay libros y artículos sobre el tema (por ejemplo, por Graeme Ritchie ).
La única forma de lograrlo es conseguir que un par de miles de personas (los monos no lo hagan, lo siento) busquen miles de oraciones / historias divertidas, las califiquen y luego construyan algún tipo de sistema / red neuronal experta. eso. Dado el alcance del problema y la subjetividad (una cosa graciosa para una persona puede no ser divertida, incluso ofensiva para otra), diría que es una tarea imposible.
Puede usar la misma técnica que los filtros de correo no deseado. En lugar de spam / no spam clasificas en divertido / no divertido. Mire en los clasificadores bayesianos ingenuos para más información.
Sí, debes usar un Cuerpo de Entrenamiento para construir un modelo predictivo capaz de detectar oraciones divertidas. A veces esto se conoce como "Análisis de sentimiento" en la literatura. Eche un vistazo a este artículo sobre Análisis de Sentimiento con LingPipe .
Si puede usar Java, puede usar su biblioteca (ver matriz de licencias ). Lo encontré muy útil, no exactamente en el mismo contexto que tú.
Además, prueba Computational Humor @ Google Scholar si realmente quieres entrar en el campo. El Análisis de Sentimientos también ha sido mencionado, ver wikipedia sobre eso.
Por supuesto, todo esto depende de cuál sea su alcance y sus objetivos ...