google - Biblioteca de clustering de Java
google drive api java (8)
Estoy buscando una biblioteca de agrupamiento ligera en Java. No necesito cientos de clúster algo en esa biblioteca solo 5 a 7 algo estaría bien para mí.
Estoy seguro de que vas a preguntar: "qué tipo de algo necesitas y con qué propósito" :). Solo necesito hacer una clasificación de mis datos con la ayuda de la agrupación. Por ejemplo, K significa.
PD: Sé de weka, pero no quiero usarlo, ya que no es específicamente para clústeres.
Apache Mahout implementa muchos algoritmos de agrupamiento a través de Hadoop. Es un poco pesado para lo que quieres, pero: http://cwiki.apache.org/MAHOUT/syntheticcontroldata.html
También es posible que pueda desenterrar y adaptar el código de clúster de usuarios de la clase TreeClusteringRecommender de Mahout, que utiliza el clúster para fines del motor de recomendación.
Echaré un vistazo a JUNG . Tiene una serie de algoritmos de agrupación implementados, aunque no estoy seguro de si K-means es uno de ellos.
Otra opción podría ser echar un vistazo a Knime , un editor de flujo de trabajo basado en Eclipse. Esto incluye varias primitivas de agrupación que puede usar como parte de un flujo de trabajo, incluidos K-means.
Hay algunos algoritmos de clústeres de código abierto en Java disponibles aquí, disponibles bajo la GPL. Requiere la biblioteca Java Colt (para matrices). http://open.trickl.com/
También existe ELKI , un proyecto universitario de código abierto similar a WEKA, pero con el enfoque en el análisis de clusters y la detección de valores atípicos en lugar de algoritmos de aprendizaje automático. Es bastante avanzado, usa estructuras de índice para la eficiencia y tiene al menos una docena de algoritmos de agrupamiento.
Si Scala también funciona para usted, entonces es posible que desee comprobar esta versión de KMeans en Scala:
https://github.com/wspringer/kmeans
Una publicación de blog relacionada está aquí:
Si quieres algunos algoritmos básicos de clustering en Java, puedes consultar mi software:
http://www.philippe-fournier-viger.com/spmf/
Ofrece una implementación de KMeans y un algoritmo de agrupamiento jerárquico.
Los otros algoritmos ofrecidos son para minería de patrones. Totalmente, hay 47 algoritmos. Pero solo 2 para agrupar. Otra cosa: hay una GUI simple para lanzar los algoritmos.
Eche un vistazo a org.apache.commons.math4.ml.clustering.KMeansPlusPlusClusterer en la biblioteca Apache''s Common Math .