open source - studio - Opciones de software de fuente abierta de datamining
rapidminer studio (10)
Estoy evaluando paquetes de datamining.
He encontrado estos dos hasta ahora:
Gracias
He usado Weka en un curso de secundaria, y tuvo una buena implementación de SVM . Esto fue hace 4 o 5 años.
Otra alternativa sería Orange . Incluye varios algoritmos y técnicas de minería de datos a las que puede acceder directamente a través de las secuencias de comandos de Python o mediante la GUI.
Vuelva a inventar la rueda y el código directamente en R!
Pentaho es un buen traje para Business Intelligence. Entonces quizás quieras echarle un vistazo. Tengo algo de experiencia en esto, principalmente para el almacenamiento de datos y estaba bastante contento.
Según las encuestas anuales de KDnuggets 2007, 2008 y 2009, RapidMiner es la solución de minería de datos de código abierto más utilizada entre los expertos en minería de datos de todo el mundo: KDnuggets Data Mining Tool Poll 2009
RapidMiner es de código abierto y 100% Java, RapidMiner es mucho más flexible y ofrece muchas más funcionalidades que Weka y KNIME.
En cuanto a las implementaciones de SVM: Weka viene con una implementación de este tipo (LibSVM), mientras que RapidMiner proporciona cuatro implementaciones de SVM (LibSVM, MySVM, EvoSVM, SMO-SVM), algunas de ellas con características más avanzadas.
Como se dijo antes, Pentaho es una poderosa suite de Business Intelligence a la que pertenece WEKA.
Así que también recomiendo a Weka, solo por el hecho de que tiene una gran solución para ampliar su aplicación y una gran comunidad también.
( KNIME ) es una plataforma de minería de datos bastante extensa.
Según KDnuggets Poll 2011, RapidMiner es una vez más la solución de minería de datos más utilizada en todo el mundo: http://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html
Si está interesado en algún código Java relacionado con la minería de patrones frecuentes, las reglas de asociación y la minería de patrones secuencial , tengo un pequeño proyecto de código abierto que tiene 42 algoritmos relacionados con estos temas: http: //www.philippe-fournier-viger. com / spmf /
Sin embargo, tenga en cuenta que no proporciona ninguna interfaz de usuario. Pero proporciona algunos algoritmos muy especializados que no encontrará en otros paquetes de minería de datos.
Eche un vistazo a ELKI , que es como WEKA, excepto que es mucho más potente en clustering y detección de valores atípicos, mientras que WEKA básicamente solo hace una buena clasificación.