Configurar un proyecto

En este capítulo, comprenderemos el proceso involucrado en la configuración de un proyecto para realizar regresión logística en Python, en detalle.

Instalación de Jupyter

Usaremos Jupyter, una de las plataformas más utilizadas para el aprendizaje automático. Si no tiene Jupyter instalado en su máquina, descárguelo desde aquí . Para la instalación, puede seguir las instrucciones en su sitio para instalar la plataforma. Como sugiere el sitio, es posible que prefiera utilizarAnaconda Distributionque viene junto con Python y muchos paquetes de Python de uso común para informática científica y ciencia de datos. Esto aliviará la necesidad de instalar estos paquetes individualmente.

Después de la instalación exitosa de Jupyter, comience un nuevo proyecto, su pantalla en esta etapa se vería como la siguiente lista para aceptar su código.

Ahora, cambie el nombre del proyecto de Untitled1 to “Logistic Regression” haciendo clic en el nombre del título y editándolo.

Primero, vamos a importar varios paquetes de Python que necesitaremos en nuestro código.

Importación de paquetes de Python

Para ello, escriba o corte y pegue el siguiente código en el editor de código:

In [1]: # import statements
   import pandas as pd
   import numpy as np
   import matplotlib.pyplot as plt

   from sklearn import preprocessing
   from sklearn.linear_model import LogisticRegression
   from sklearn.model_selection import train_test_split

Tu Notebook debería tener el siguiente aspecto en esta etapa:

Ejecute el código haciendo clic en el Runbotón. Si no se generan errores, ha instalado Jupyter correctamente y ahora está listo para el resto del desarrollo.

Las primeras tres declaraciones de importación importan paquetes pandas, numpy y matplotlib.pyplot en nuestro proyecto. Las siguientes tres declaraciones importan los módulos especificados de sklearn.

Nuestra siguiente tarea es descargar los datos necesarios para nuestro proyecto. Aprenderemos esto en el próximo capítulo.