Serie temporal: modelado

Introducción

Una serie de tiempo tiene 4 componentes como se indica a continuación:

  • Level - Es el valor medio alrededor del cual varía la serie.

  • Trend - Es el comportamiento creciente o decreciente de una variable con el tiempo.

  • Seasonality - Es el comportamiento cíclico de las series de tiempo.

  • Noise - Es el error en las observaciones agregado debido a factores ambientales.

Técnicas de modelado de series temporales

Para capturar estos componentes, existen varias técnicas populares de modelado de series de tiempo. Esta sección ofrece una breve introducción de cada técnica; sin embargo, las analizaremos en detalle en los próximos capítulos:

Métodos ingenuos

Estas son técnicas de estimación simples, como por ejemplo, al valor predicho se le da el valor igual a la media de los valores anteriores de la variable dependiente del tiempo, o el valor real anterior. Estos se utilizan para comparar con técnicas de modelado sofisticadas.

Regresión automática

La regresión automática predice los valores de períodos de tiempo futuros en función de los valores de períodos de tiempo anteriores. Las predicciones de la regresión automática pueden ajustarse mejor a los datos que las de los métodos ingenuos, pero es posible que no puedan tener en cuenta la estacionalidad.

Modelo ARIMA

Una media móvil integrada auto-regresiva modela el valor de una variable como una función lineal de valores previos y errores residuales en pasos de tiempo previos de una serie temporal estacionaria. Sin embargo, los datos del mundo real pueden ser no estacionarios y tener estacionalidad, por lo que se desarrollaron Seasonal-ARIMA y Fractional-ARIMA. ARIMA trabaja en series de tiempo univariadas, para manejar múltiples variables se introdujo VARIMA.

Suavizado exponencial

Modela el valor de una variable como una función lineal ponderada exponencial de valores anteriores. Este modelo estadístico también puede manejar tendencias y estacionalidad.

LSTM

El modelo de memoria a largo plazo a corto plazo (LSTM) es una red neuronal recurrente que se utiliza para series de tiempo para tener en cuenta las dependencias a largo plazo. Se puede entrenar con una gran cantidad de datos para capturar las tendencias en series de tiempo multivariadas.

Dichas técnicas de modelado se utilizan para la regresión de series de tiempo. En los próximos capítulos, exploremos todos estos uno por uno.