modelos machine learning español ejemplo clasificacion algoritmos python machine-learning

ejemplo - machine learning python español pdf



¿Hay algún paquete recomendado para el aprendizaje automático en Python? (14)

Eche un vistazo al kit de herramientas modular para procesamiento de datos (MDP) . Implementa un par de algoritmos de aprendizaje automático y estadísticas, y está maduro y bien documentado.

¿Hay algún paquete recomendado para el aprendizaje automático en Python?

Tengo experiencia previa en la implementación de una variedad de algoritmos de aprendizaje automático y estadísticos en C ++ y MATLAB , pero después de haber hecho algún trabajo en Python, tengo curiosidad acerca de los paquetes disponibles para Python.




Le di una oportunidad a Orange .

Es poderoso, pero si revisas la documentación, te darás cuenta de que el autor tiene su propio estilo loco de escribir Python. Su código es bastante críptico si eres relativamente nuevo en Python, por lo que no recomendaría Orange a menos que estés familiarizado con Python.


No estoy seguro de que llamaría exactamente a esta máquina de aprendizaje, pero el paquete nltk hace una clasificación de texto de estilo bayesiano. Puede usar los datos de aprendizaje y los datos de prueba para ver que infiere reglas sobre los datos.


Para Support Vector Machines, eche un vistazo a LibSVM que, entre otros, tiene la interfaz de Python.



Si está buscando una red neuronal, el enlace de python para fann es bastante fácil de usar y viene con herramientas para entrenar sus redes


También hay scikit-learn (BSD, con solo dependencias en numpy y scipy). Incluye varios algoritmos de aprendizaje supervisado tales como:

  • SVM basado en libsvm y lineal con enlaces scipy.sparse para conjuntos de datos de amplias características
  • métodos bayesianos
  • HMMs
  • Los métodos de regresión regularizados L1 y L1 + L2 también conocidos como los modelos Lasso y Elastic Net implementados con algoritmos tales como LARS y descendencia coordinada

También presenta algoritmos de agrupamiento no supervisados ​​como:

  • kmeans ++
  • cambio de medios
  • propagación de afinidad
  • agrupamiento espectral

Y también otras herramientas como:

  • extractores de funciones para contenido de texto (token y caracteres de texto + vectorizador hash)
  • selecciones de funciones univariadas
  • una simple herramienta de línea de tubería
  • numerosas implementaciones de estrategias de validación cruzada
  • evaluación y ploteo de métricas de rendimiento (curva ROC, AUC, matriz de confusión, ...)
  • una utilidad de búsqueda de grillas para realizar la optimización de hiperparámetros mediante la validación cruzada paralela
  • integración con joblib para el almacenamiento en caché de resultados parciales cuando se trabaja en un entorno interactivo (por ejemplo, usando ipython)

Cada implementación de algoritmo viene con programas de muestra que demuestran su uso en datos de juguete o en conjuntos de datos de la vida real.

Además, el repositorio de fuentes oficial está alojado en github, así que siéntase libre de contribuir con las correcciones de errores y la mejora mediante la función de solicitud de extracción regular para la revisión de código interactivo.


Un paquete amigable para el usuario general es Orange , algo así como Weka o RapidMiner, si está familiarizado con ellos.

Aparte de eso, hay una variedad de paquetes y kits de herramientas para diversas tareas. Debería consultar los paquetes de Python listados en mloss como punto de partida.



SVMlight veces es una alternativa útil a LibSVM ! LibSVM también es fantástico, sin embargo.