Serie temporal: métricas de error
Es importante para nosotros cuantificar el desempeño de un modelo para usarlo como retroalimentación y comparación. En este tutorial hemos utilizado una de las métricas de error más populares del error cuadrático medio de la raíz. Hay varias otras métricas de error disponibles. Este capítulo los analiza brevemente.
Error cuadrático medio
Es el promedio del cuadrado de la diferencia entre los valores predichos y los valores verdaderos. Sklearn lo proporciona como una función. Tiene las mismas unidades que los valores verdadero y pronosticado al cuadrado y siempre es positivo.
$$ MSE = \ frac {1} {n} \ Displaystyle \ sum \ limits_ {t = 1} ^ n \ lgroup y '_ {t} \: - y_ {t} \ rgroup ^ {2} $$
Donde $ y '_ {t} $ es el valor predicho,
$ y_ {t} $ es el valor real y
n es el número total de valores en el conjunto de prueba.
De la ecuación se desprende claramente que MSE penaliza más los errores más grandes o los valores atípicos.
Error cuadrático medio
Es la raíz cuadrada del error cuadrático medio. También es siempre positivo y está en el rango de los datos.
$$ RMSE = \ sqrt {\ frac {1} {n} \ Displaystyle \ sum \ limits_ {t = 1} ^ n \ lgroup y '_ {t} -y_ {t} \ rgroup ^ 2} $$
Donde, $ y '_ {t} $ es el valor predicho
$ y_ {t} $ es el valor real y
n es el número total de valores en el conjunto de prueba.
Está en el poder de la unidad y, por lo tanto, es más interpretable en comparación con MSE. RMSE también penaliza más los errores más grandes. Hemos utilizado la métrica RMSE en nuestro tutorial.
Error absoluto medio
Es el promedio de la diferencia absoluta entre los valores predichos y los valores verdaderos. Tiene las mismas unidades que el valor predicho y verdadero y siempre es positivo.
$$ MAE = \ frac {1} {n} \ Displaystyle \ sum \ limits_ {t = 1} ^ {t = n} | y '{t} -y_ {t} \ lvert $$
Donde, $ y '_ {t} $ es el valor predicho,
$ y_ {t} $ es el valor real y
n es el número total de valores en el conjunto de prueba.
Error de porcentaje medio
Es el porcentaje del promedio de diferencia absoluta entre los valores predichos y los valores verdaderos, dividido por el valor verdadero.
$$ MAPE = \ frac {1} {n} \ Displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {y '_ {t} -y_ {t}} {y_ {t}} * 100 \: \% $$
Donde, $ y '_ {t} $ es el valor predicho,
$ y_ {t} $ es el valor real y n es el número total de valores en el conjunto de prueba.
Sin embargo, la desventaja de usar este error es que el error positivo y los errores negativos pueden compensarse entre sí. Por tanto, se utiliza el error porcentual absoluto medio.
Error de porcentaje absoluto medio
Es el porcentaje del promedio de diferencia absoluta entre los valores predichos y los valores verdaderos, dividido por el valor verdadero.
$$ MAPE = \ frac {1} {n} \ Displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {| y '_ {t} -y_ {t} \ lvert} {y_ {t}} * 100 \: \% $$
Donde $ y '_ {t} $ es el valor predicho
$ y_ {t} $ es el valor real y
n es el número total de valores en el conjunto de prueba.