nlp - funciona - naive bayes pasos
Clasificador de Bayes ingenuo a gran escala con salida top-k (1)
Si también es aceptable un algoritmo de aprendizaje aparte de ingenuo Bayes, entonces echa un vistazo a Vowpal Wabbit (C ++), que tiene la reputación de ser uno de los mejores algoritmos de clasificación de texto escalables (descenso en gradiente estocástico en línea + LDA). No estoy seguro de si tiene salida K superior.
Necesito una biblioteca para gran escala de Bayes ingenua, con millones de ejemplos de entrenamiento y más de 100k características binarias. Debe ser una versión en línea (actualizable después del entrenamiento). También necesito salida top-k, es decir, múltiples clasificaciones para una sola instancia. La precisión no es muy importante.
El objetivo es una aplicación de categorización de texto automática.
Cualquier sugerencia para una buena biblioteca es muy apreciada.
EDITAR: la biblioteca debe estar preferiblemente en Java.