Python: entorno de procesamiento de texto
Para crear y ejecutar con éxito el código de ejemplo en este tutorial, necesitaremos una configuración de entorno que tenga tanto Python de propósito general como los paquetes especiales necesarios para la ciencia de datos. Primero veremos como instalar Python de propósito general, que puede ser Python 2 o Python 3. Pero preferiremos Python 2 para este tutorial principalmente debido a su madurez y soporte más amplio de paquetes externos.
Obtener Python
El código fuente, los binarios, la documentación, las noticias, etc. más actualizados y actualizados están disponibles en el sitio web oficial de Python https://www.python.org/
Puede descargar la documentación de Python desde https://www.python.org/doc/. La documentación está disponible en formatos HTML, PDF y PostScript.
Instalación de Python
La distribución de Python está disponible para una amplia variedad de plataformas. Debe descargar solo el código binario aplicable para su plataforma e instalar Python.
Si el código binario de su plataforma no está disponible, necesita un compilador C para compilar el código fuente manualmente. Compilar el código fuente ofrece más flexibilidad en cuanto a la elección de las funciones que necesita en su instalación.
Aquí hay una descripción general rápida de la instalación de Python en varias plataformas:
Instalación de Unix y Linux
Estos son los pasos simples para instalar Python en una máquina Unix / Linux.
Abra un navegador web y vaya a https://www.python.org/downloads/.
Siga el enlace para descargar el código fuente comprimido disponible para Unix / Linux.
Descarga y extrae archivos.
Editando el archivo Módulos / Configuración si desea personalizar algunas opciones.
ejecutar ./configure script
make
hacer instalar
Esto instala Python en la ubicación estándar / usr / local / bin y sus bibliotecas en / usr / local / lib / pythonXX donde XX es la versión de Python.
Instalación de Windows
Estos son los pasos para instalar Python en una máquina con Windows.
Abra un navegador web y vaya a https://www.python.org/downloads/.
Siga el enlace del archivo de instalación de Windows python-XYZ.msi donde XYZ es la versión que necesita instalar.
Para utilizar este instalador python-XYZ.msi , el sistema Windows debe ser compatible con Microsoft Installer 2.0. Guarde el archivo de instalación en su máquina local y luego ejecútelo para averiguar si su máquina es compatible con MSI.
Ejecute el archivo descargado. Esto abre el asistente de instalación de Python, que es realmente fácil de usar. Simplemente acepte la configuración predeterminada, espere hasta que finalice la instalación y listo.
Instalación en Macintosh
Las Mac recientes vienen con Python instalado, pero pueden estar desactualizados por varios años. Verhttp://www.python.org/download/mac/para obtener instrucciones sobre cómo obtener la versión actual junto con herramientas adicionales para respaldar el desarrollo en Mac. Para Mac OS anteriores a Mac OS X 10.3 (lanzado en 2003), MacPython está disponible.
Jack Jansen lo mantiene y puede tener acceso completo a toda la documentación en su sitio web: http://www.cwi.nl/~jack/macpython.html. Puede encontrar los detalles de instalación completos para la instalación de Mac OS.
Configurando PATH
Los programas y otros archivos ejecutables pueden estar en muchos directorios, por lo que los sistemas operativos proporcionan una ruta de búsqueda que enumera los directorios en los que el sistema operativo busca ejecutables.
La ruta se almacena en una variable de entorno, que es una cadena con nombre mantenida por el sistema operativo. Esta variable contiene información disponible para el shell de comandos y otros programas.
los path La variable se denomina PATH en Unix o Path en Windows (Unix distingue entre mayúsculas y minúsculas; Windows no).
En Mac OS, el instalador maneja los detalles de la ruta. Para invocar al intérprete de Python desde cualquier directorio en particular, debe agregar el directorio de Python a su ruta.
Configuración de ruta en Unix / Linux
Para agregar el directorio de Python a la ruta de una sesión en particular en Unix:
In the csh shell - escriba setenv PATH "$ PATH: / usr / local / bin / python" y presione Enter.
In the bash shell (Linux) - escriba export ATH = "$ PATH: / usr / local / bin / python" y presione Enter.
In the sh or ksh shell - escriba PATH = "$ PATH: / usr / local / bin / python" y presione Enter.
Note - / usr / local / bin / python es la ruta del directorio de Python
Configuración de ruta en Windows
Para agregar el directorio de Python a la ruta de una sesión en particular en Windows:
At the command prompt - escriba path% path%; C: \ Python y presione Enter.
Note - C: \ Python es la ruta del directorio de Python
Variables de entorno de Python
Aquí hay importantes variables de entorno, que Python puede reconocer:
No Señor. | Variable y descripción |
---|---|
1 | PYTHONPATH Tiene una función similar a PATH. Esta variable le dice al intérprete de Python dónde ubicar los archivos de módulo importados a un programa. Debe incluir el directorio de la biblioteca fuente de Python y los directorios que contienen el código fuente de Python. PYTHONPATH a veces está predeterminado por el instalador de Python. |
2 | PYTHONSTARTUP Contiene la ruta de un archivo de inicialización que contiene el código fuente de Python. Se ejecuta cada vez que inicia el intérprete. Se denomina .pythonrc.py en Unix y contiene comandos que cargan utilidades o modifican PYTHONPATH. |
3 | PYTHONCASEOK Se usa en Windows para indicarle a Python que busque la primera coincidencia que no distinga entre mayúsculas y minúsculas en una declaración de importación. Establezca esta variable en cualquier valor para activarla. |
4 | PYTHONHOME Es una ruta de búsqueda de módulos alternativa. Por lo general, está integrado en los directorios PYTHONSTARTUP o PYTHONPATH para facilitar el cambio de bibliotecas de módulos. |
Ejecutando Python
Hay tres formas diferentes de iniciar Python:
Intérprete interactivo
Puede iniciar Python desde Unix, DOS o cualquier otro sistema que le proporcione un intérprete de línea de comandos o una ventana de shell.
Entrar python la línea de comando.
Comience a codificar de inmediato en el intérprete interactivo.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Aquí está la lista de todas las opciones de línea de comando disponibles:
No Señor. | Opción y descripción |
---|---|
1 | -d Proporciona salida de depuración. |
2 | -O Genera código de bytes optimizado (resultando en archivos .pyo). |
3 | -S No ejecute el sitio de importación para buscar rutas de Python al inicio. |
4 | -v salida detallada (seguimiento detallado en declaraciones de importación). |
5 | -X deshabilitar las excepciones integradas basadas en clases (solo use cadenas); obsoleto a partir de la versión 1.6. |
6 | -c cmd ejecutar el script de Python enviado como cmd string |
7 | file ejecutar el script de Python desde el archivo dado |
Script de la línea de comandos
Una secuencia de comandos de Python se puede ejecutar en la línea de comandos invocando al intérprete en su aplicación, como se muestra a continuación:
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Asegúrese de que el modo de permiso de archivo permita la ejecución.
Entorno de desarrollo integrado
También puede ejecutar Python desde un entorno de interfaz gráfica de usuario (GUI), si tiene una aplicación GUI en su sistema que admita Python.
Unix - IDLE es el primer IDE de Unix para Python.
Windows - PythonWin es la primera interfaz de Windows para Python y es un IDE con una GUI.
Macintosh - La versión Macintosh de Python junto con IDLE IDE está disponible en el sitio web principal, descargable como archivos MacBinary o BinHex'd.
Instalación del paquete NLTK
NLTK es muy sencillo de integrar en el entorno de Python. Utilice el siguiente comando para agregar NLTK al entorno.
sudo pip install -U nltk
La adición de otras bibliotecas se discutirá en cada capítulo cuando sea necesario para su uso en el programa Python.