Regresión logística en Python - Resumen

La regresión logística es una técnica estadística de clasificación binaria. En este tutorial, aprendió cómo entrenar la máquina para usar la regresión logística. Al crear modelos de aprendizaje automático, el requisito más importante es la disponibilidad de los datos. Sin datos adecuados y relevantes, no puede simplemente hacer que la máquina aprenda.

Una vez que tenga los datos, su próxima tarea importante es limpiar los datos, eliminar las filas y campos no deseados y seleccionar los campos adecuados para el desarrollo de su modelo. Una vez hecho esto, debe mapear los datos en un formato requerido por el clasificador para su entrenamiento. Por lo tanto, la preparación de datos es una tarea importante en cualquier aplicación de aprendizaje automático. Una vez que esté listo con los datos, puede seleccionar un tipo particular de clasificador.

En este tutorial, aprendió a utilizar un clasificador de regresión logística proporcionado en el sklearnbiblioteca. Para entrenar al clasificador, usamos aproximadamente el 70% de los datos para entrenar el modelo. Usamos el resto de los datos para realizar pruebas. Probamos la precisión del modelo. Si esto no está dentro de los límites aceptables, volvemos a seleccionar el nuevo conjunto de características.

Una vez más, siga todo el proceso de preparación de datos, entrene el modelo y pruébelo hasta que esté satisfecho con su precisión. Antes de emprender cualquier proyecto de aprendizaje automático, debe aprender y estar expuesto a una amplia variedad de técnicas que se han desarrollado hasta ahora y que se han aplicado con éxito en la industria.