Serie temporal: bibliotecas de Python

Python tiene una popularidad establecida entre las personas que realizan aprendizaje automático debido a su estructura de código fácil de escribir y comprender, así como a una amplia variedad de bibliotecas de código abierto. Algunas de estas bibliotecas de código abierto que usaremos en los próximos capítulos se presentan a continuación.

NumPy

Python numérico es una biblioteca utilizada para la informática científica. Funciona en un objeto de matriz N-dimensional y proporciona funcionalidad matemática básica como tamaño, forma, media, desviación estándar, mínimo, máximo, así como algunas funciones más complejas como funciones algebraicas lineales y transformada de Fourier. Aprenderá más sobre estos a medida que avancemos en este tutorial.

Pandas

Esta biblioteca proporciona estructuras de datos altamente eficientes y fáciles de usar, como series, marcos de datos y paneles. Ha mejorado la funcionalidad de Python desde la mera recopilación y preparación de datos hasta el análisis de datos. Las dos bibliotecas, Pandas y NumPy, hacen que cualquier operación en un conjunto de datos pequeño o muy grande sea muy simple. Para saber más sobre estas funciones, siga este tutorial.

Ciencia

Science Python es una biblioteca utilizada para informática científica y técnica. Proporciona funcionalidades para optimización, procesamiento de señales e imágenes, integración, interpolación y álgebra lineal. Esta biblioteca es útil al realizar el aprendizaje automático. Discutiremos estas funcionalidades a medida que avancemos en este tutorial.

Aprender Scikit

Esta biblioteca es un kit de herramientas SciPy ampliamente utilizado para el modelado estadístico, el aprendizaje automático y el aprendizaje profundo, ya que contiene varios modelos de regresión, clasificación y agrupación personalizables. Funciona bien con Numpy, Pandas y otras bibliotecas, lo que facilita su uso.

Statsmodels

Al igual que Scikit Learn, esta biblioteca se utiliza para la exploración de datos estadísticos y el modelado estadístico. También funciona bien con otras bibliotecas de Python.

Matplotlib

Esta biblioteca se utiliza para la visualización de datos en varios formatos, como gráficos de líneas, gráficos de barras, mapas de calor, gráficos de dispersión, histogramas, etc. Contiene todas las funciones relacionadas con los gráficos que se requieren desde el trazado hasta el etiquetado. Discutiremos estas funcionalidades a medida que avancemos en este tutorial.

Estas bibliotecas son muy esenciales para comenzar con el aprendizaje automático con cualquier tipo de datos.

Además de las mencionadas anteriormente, otra biblioteca especialmente importante para tratar con series de tiempo es:

Fecha y hora

Esta biblioteca, con sus dos módulos: fecha y hora y calendario, proporciona toda la funcionalidad de fecha y hora necesaria para leer, formatear y manipular la hora.

Usaremos estas bibliotecas en los próximos capítulos.