library google for apis java math cluster-analysis

google - Biblioteca de clustering de Java



google drive api java (8)

Estoy buscando una biblioteca de agrupamiento ligera en Java. No necesito cientos de clúster algo en esa biblioteca solo 5 a 7 algo estaría bien para mí.

Estoy seguro de que vas a preguntar: "qué tipo de algo necesitas y con qué propósito" :). Solo necesito hacer una clasificación de mis datos con la ayuda de la agrupación. Por ejemplo, K significa.

PD: Sé de weka, pero no quiero usarlo, ya que no es específicamente para clústeres.


Apache Mahout implementa muchos algoritmos de agrupamiento a través de Hadoop. Es un poco pesado para lo que quieres, pero: http://cwiki.apache.org/MAHOUT/syntheticcontroldata.html

También es posible que pueda desenterrar y adaptar el código de clúster de usuarios de la clase TreeClusteringRecommender de Mahout, que utiliza el clúster para fines del motor de recomendación.


Echaré un vistazo a JUNG . Tiene una serie de algoritmos de agrupación implementados, aunque no estoy seguro de si K-means es uno de ellos.

Otra opción podría ser echar un vistazo a Knime , un editor de flujo de trabajo basado en Eclipse. Esto incluye varias primitivas de agrupación que puede usar como parte de un flujo de trabajo, incluidos K-means.


Hay algunos algoritmos de clústeres de código abierto en Java disponibles aquí, disponibles bajo la GPL. Requiere la biblioteca Java Colt (para matrices). http://open.trickl.com/


También existe ELKI , un proyecto universitario de código abierto similar a WEKA, pero con el enfoque en el análisis de clusters y la detección de valores atípicos en lugar de algoritmos de aprendizaje automático. Es bastante avanzado, usa estructuras de índice para la eficiencia y tiene al menos una docena de algoritmos de agrupamiento.


El software Cytoscape tiene varios complementos que implementan algoritmos de agrupamiento para redes y datos numéricos (Nemo, MCODE, clusterMaker, etc.). Todos los complementos son de código abierto.



Si quieres algunos algoritmos básicos de clustering en Java, puedes consultar mi software:

http://www.philippe-fournier-viger.com/spmf/

Ofrece una implementación de KMeans y un algoritmo de agrupamiento jerárquico.

Los otros algoritmos ofrecidos son para minería de patrones. Totalmente, hay 47 algoritmos. Pero solo 2 para agrupar. Otra cosa: hay una GUI simple para lanzar los algoritmos.