Regresión logística en Python: estudio de caso
Considere que un banco se acerca a usted para desarrollar una aplicación de aprendizaje automático que los ayudará a identificar a los clientes potenciales que abrirían un Depósito a plazo (también llamado Depósito fijo por algunos bancos) con ellos. El banco realiza periódicamente una encuesta mediante llamadas telefónicas o formularios web para recopilar información sobre los clientes potenciales. La encuesta es de naturaleza general y se lleva a cabo entre un público muy amplio, de los cuales es posible que muchos no estén interesados en tratar con este banco. Del resto, solo unos pocos pueden estar interesados en abrir un depósito a plazo. Otros pueden estar interesados en otras facilidades que ofrece el banco. Por lo tanto, la encuesta no se realiza necesariamente para identificar a los clientes que abren TD. Su tarea es identificar a todos aquellos clientes con alta probabilidad de abrir TD a partir de los enormes datos de la encuesta que el banco compartirá con usted.
Afortunadamente, uno de esos tipos de datos está disponible públicamente para aquellos que aspiran a desarrollar modelos de aprendizaje automático. Estos datos fueron preparados por algunos estudiantes de UC Irvine con financiamiento externo. La base de datos está disponible como parte deUCI Machine Learning Repositoryy es ampliamente utilizado por estudiantes, educadores e investigadores de todo el mundo. Los datos se pueden descargar desde aquí .
En los siguientes capítulos, realicemos ahora el desarrollo de la aplicación utilizando los mismos datos.