Python: configuración del entorno de ciencia de datos

Para crear y ejecutar con éxito el código de ejemplo en este tutorial, necesitaremos una configuración de entorno que tenga tanto Python de uso general como los paquetes especiales necesarios para la ciencia de datos. Primero veremos como instalar el Python de propósito general que puede ser Python 2 o Python 3. Pero preferiremos Python 2 para este tutorial principalmente debido a su madurez y mayor soporte de paquetes externos.

Obteniendo Python

El código fuente, los binarios, la documentación, las noticias, etc. más actualizados y actualizados están disponibles en el sitio web oficial de Python https://www.python.org/

Puede descargar la documentación de Python desde https://www.python.org/doc/. La documentación está disponible en formatos HTML, PDF y PostScript.

Instalación de Python

La distribución de Python está disponible para una amplia variedad de plataformas. Necesita descargar solo el código binario aplicable para su plataforma e instalar Python.

Si el código binario para su plataforma no está disponible, necesita un compilador C para compilar el código fuente manualmente. La compilación del código fuente ofrece más flexibilidad en cuanto a la elección de las funciones que necesita en su instalación.

Aquí hay una descripción general rápida de la instalación de Python en varias plataformas:

Instalación de Unix y Linux

Estos son los pasos simples para instalar Python en una máquina Unix / Linux.

  • Abra un navegador web y vaya a https://www.python.org/downloads/.

  • Siga el enlace para descargar el código fuente comprimido disponible para Unix / Linux.

  • Descarga y extrae archivos.

  • Editando el archivo Módulos / Configuración si desea personalizar algunas opciones.

  • ejecutar ./configure script

  • make

  • hacer instalar

Esto instala Python en la ubicación estándar / usr / local / bin y sus bibliotecas en / usr / local / lib / pythonXX donde XX es la versión de Python.

Instalación de Windows

Estos son los pasos para instalar Python en una máquina con Windows.

  • Abra un navegador web y vaya a https://www.python.org/downloads/.

  • Siga el enlace del archivo del instalador de Windows python-XYZ.msi , donde XYZ es la versión que necesita instalar.

  • Para utilizar este instalador python-XYZ.msi , el sistema Windows debe ser compatible con Microsoft Installer 2.0. Guarde el archivo de instalación en su máquina local y luego ejecútelo para averiguar si su máquina es compatible con MSI.

  • Ejecute el archivo descargado. Esto abre el asistente de instalación de Python, que es realmente fácil de usar. Simplemente acepte la configuración predeterminada, espere hasta que finalice la instalación y listo.

Instalación en Macintosh

Los Mac recientes vienen con Python instalado, pero pueden estar desactualizados por varios años. Verhttp://www.python.org/download/mac/para obtener instrucciones sobre cómo obtener la versión actual junto con herramientas adicionales para respaldar el desarrollo en Mac. Para Mac OS anteriores a Mac OS X 10.3 (lanzado en 2003), MacPython está disponible.

Jack Jansen lo mantiene y puede tener acceso completo a toda la documentación en su sitio web: http://www.cwi.nl/~jack/macpython.html. Puede encontrar los detalles de instalación completos para la instalación de Mac OS.

Configurando PATH

Los programas y otros archivos ejecutables pueden estar en muchos directorios, por lo que los sistemas operativos proporcionan una ruta de búsqueda que enumera los directorios en los que el sistema operativo busca ejecutables.

La ruta se almacena en una variable de entorno, que es una cadena con nombre mantenida por el sistema operativo. Esta variable contiene información disponible para el shell de comandos y otros programas.

los path La variable se denomina PATH en Unix o Path en Windows (Unix distingue entre mayúsculas y minúsculas; Windows no).

En Mac OS, el instalador maneja los detalles de la ruta. Para invocar al intérprete de Python desde cualquier directorio en particular, debe agregar el directorio de Python a su ruta.

Configuración de ruta en Unix / Linux

Para agregar el directorio de Python a la ruta de una sesión en particular en Unix:

  • In the csh shell - escriba setenv PATH "$ PATH: / usr / local / bin / python" y presione Enter.

  • In the bash shell (Linux) - escriba export ATH = "$ PATH: / usr / local / bin / python" y presione Enter.

  • In the sh or ksh shell - escriba PATH = "$ PATH: / usr / local / bin / python" y presione Enter.

  • Note - / usr / local / bin / python es la ruta del directorio de Python

Configuración de ruta en Windows

Para agregar el directorio de Python a la ruta de una sesión en particular en Windows:

At the command prompt - escriba path% path%; C: \ Python y presione Enter.

Note - C: \ Python es la ruta del directorio de Python

Variables de entorno de Python

Aquí hay importantes variables de entorno, que Python puede reconocer:

No Señor. Variable y descripción
1

PYTHONPATH

Tiene una función similar a PATH. Esta variable le dice al intérprete de Python dónde ubicar los archivos de módulo importados a un programa. Debe incluir el directorio de la biblioteca fuente de Python y los directorios que contienen el código fuente de Python. PYTHONPATH a veces está predeterminado por el instalador de Python.

2

PYTHONSTARTUP

Contiene la ruta de un archivo de inicialización que contiene el código fuente de Python. Se ejecuta cada vez que inicia el intérprete. Se llama .pythonrc.py en Unix y contiene comandos que cargan utilidades o modifican PYTHONPATH.

3

PYTHONCASEOK

Se usa en Windows para indicar a Python que busque la primera coincidencia que no distinga entre mayúsculas y minúsculas en una declaración de importación. Establezca esta variable en cualquier valor para activarla.

4

PYTHONHOME

Es una ruta de búsqueda de módulos alternativa. Por lo general, está integrado en los directorios PYTHONSTARTUP o PYTHONPATH para facilitar el cambio de bibliotecas de módulos.

Ejecutando Python

Hay tres formas diferentes de iniciar Python:

Intérprete interactivo

Puede iniciar Python desde Unix, DOS o cualquier otro sistema que le proporcione un intérprete de línea de comandos o una ventana de shell.

Entrar python la línea de comando.

Comience a codificar de inmediato en el intérprete interactivo.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Aquí está la lista de todas las opciones de línea de comando disponibles:

No Señor. Opción y descripción
1

-d

Proporciona salida de depuración.

2

-O

Genera código de bytes optimizado (lo que da como resultado archivos .pyo).

3

-S

No ejecute el sitio de importación para buscar rutas de Python al inicio.

4

-v

salida detallada (seguimiento detallado en declaraciones de importación).

5

-X

deshabilitar las excepciones integradas basadas en clases (solo use cadenas); obsoleto a partir de la versión 1.6.

6

-c cmd

ejecutar el script de Python enviado como cmd string

7

file

ejecutar el script de Python desde el archivo dado

Script de la línea de comandos

Se puede ejecutar una secuencia de comandos de Python en la línea de comando invocando al intérprete en su aplicación, como se muestra a continuación:

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note - Asegúrese de que el modo de permiso de archivo permita la ejecución.

Entorno de desarrollo integrado

También puede ejecutar Python desde un entorno de interfaz gráfica de usuario (GUI), si tiene una aplicación GUI en su sistema que admita Python.

  • Unix - IDLE es el primer IDE de Unix para Python.

  • Windows - PythonWin es la primera interfaz de Windows para Python y es un IDE con una GUI.

  • Macintosh - La versión Macintosh de Python junto con IDLE IDE está disponible en el sitio web principal, descargable como archivos MacBinary o BinHex'd.

Instalación de SciPy Pack

La mejor manera de habilitar los paquetes necesarios es utilizar un paquete binario instalable específico para su sistema operativo. Estos binarios contienen una pila completa de SciPy (incluidos los paquetes NumPy, SciPy, matplotlib, IPython, SymPy y nose junto con el núcleo Python).

Ventanas

Anaconda (de www.continuum.io ) es una distribución gratuita de Python para la pila SciPy. También está disponible para Linux y Mac.

Canopy ( www.enthought.com/products/canopy/ ) está disponible como distribución gratuita y comercial con una pila completa de SciPy para Windows, Linux y Mac.

Python (x, y): es una distribución gratuita de Python con SciPy stack y Spyder IDE para el sistema operativo Windows. (Descargable de www.python-xy.github.io/ )

Linux

Los administradores de paquetes de las respectivas distribuciones de Linux se utilizan para instalar uno o más paquetes en la pila SciPy.

Para Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

Para Fedora

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

Construyendo desde la fuente

Core Python (2.6.x, 2.7.xy 3.2.x en adelante) debe instalarse con distutils y el módulo zlib debe estar habilitado.

El compilador GNU gcc (4.2 y superior) C debe estar disponible.

Para instalar NumPy, ejecute el siguiente comando.

Python setup.py install

Probemos si el módulo NumPy está instalado correctamente, intente importarlo desde el indicador de Python.

Si no está instalado, se mostrará el siguiente mensaje de error.

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

De manera similar, podemos verificar la instalación de todos los paquetes de ciencia de datos requeridos que se muestran en los siguientes capítulos.