machine-learning neural-network deep-learning keras

machine learning - ¿Cuál es la diferencia entre la función de pérdida y la métrica en Keras?



machine-learning neural-network (3)

La función de pérdida es que el parámetro uno pasa a Keras model.compile, que en realidad está optimizado mientras se entrena el modelo. Esta función de pérdida generalmente es minimizada por el modelo.

A diferencia de la función de pérdida, la métrica es otra lista de parámetros pasados ​​a Keras model.compile que en realidad se usa para juzgar el rendimiento del modelo.

Por ejemplo: por alguna razón, es posible que desee minimizar la pérdida de MSE para un modelo de regresión, mientras que también desea verificar el AUC para el modelo. En este caso, el MSE es la función de pérdida y el AUC es la métrica. La métrica es el parámetro de rendimiento del modelo que se puede ver mientras el modelo se juzga a sí mismo en el conjunto de validación después de cada época de entrenamiento. Es importante tener en cuenta que la métrica es importante para algunas devoluciones de llamada de Keras como EarlyStopping cuando uno quiere dejar de entrenar el modelo en caso de que la métrica no esté mejorando para un determinado no. de épocas.

No está claro para mí la diferencia entre la función de pérdida y las métricas en Keras. La documentación no me fue útil.


La función de pérdida se utiliza para optimizar su modelo. Esta es la función que el optimizador minimizará.

Se utiliza una métrica para juzgar el rendimiento de su modelo. Esto es solo para que lo veas y no tiene nada que ver con el proceso de optimización.


Tengo un ejemplo artificial en mente: pensemos en la regresión lineal en un plano 2D. En este caso, la función de pérdida sería el error cuadrático medio, la línea ajustada minimizaría este error.

Sin embargo, por alguna razón, estamos muy interesados ​​en el área bajo la curva de 0 a 1 de nuestra línea ajustada, y por lo tanto esta puede ser una de las métricas. Y monitoreamos esta métrica mientras el modelo minimiza la función de pérdida de error cuadrática media.