red neuronal – ¿Debo usar la pérdida o la precisión como la métrica de detención temprana?

Estoy aprendiendo y experimentando con redes neuronales y me gustaría tener la opinión de alguien con más experiencia en el siguiente tema:

Cuando entreno un Autoencoder en Keras (función de pérdida ‘mean_squared_error’ y optimizador SGD), la pérdida de validación está disminuyendo gradualmente. y la exactitud de la validación va en aumento. Hasta ahora tan bueno.

Sin embargo, después de un tiempo, la pérdida sigue disminuyendo, pero la precisión cae repentinamente a un nivel bajo mucho más bajo.

> ¿Es el comportamiento ‘normal’ o esperado que la precisión aumenta muy rápido y se mantiene alto para caer repentinamente?
> ¿Debo dejar de entrenar con la máxima precisión incluso si la pérdida de validación sigue disminuyendo? En otras palabras, ¿usar val_acc o val_loss como métrica para monitorear la detención temprana?

Ver imagenes

Pérdida: (verde = val, azul = tren)
enter image description here

Precisión: (verde = val, azul = tren)
enter image description here

ACTUALIZAR:
Los comentarios a continuación me indicaron la dirección correcta y creo que ahora lo entiendo mejor. Sería bueno si alguien pudiera confirmar que lo siguiente es correcto:

> la métrica de precisión mide el% de y_pred == Y_true y por lo tanto solo tiene sentido para la clasificación.
> Mis datos son una combinación de características reales y binarias. La razón por la que el gráfico de precisión aumenta mucho y luego disminuye, mientras que la pérdida continúa disminuyendo es porque alrededor de la época 5000, la red probablemente predijo / – el 50% de las características binarias correctamente. Cuando el entrenamiento continúa, alrededor de la época 12000, la predicción de características reales y binarias juntas mejoró, por lo tanto, la pérdida decreciente, pero la predicción de las características binarias solas, es un poco menos correcta. Por lo tanto, la precisión cae, mientras que la pérdida disminuye.

Mejor respuesta
Si está preguntando si desea usar la pérdida o la precisión … entonces aquí está la respuesta

Si la predicción es en tiempo real o los datos son continuos en lugar de discretos, entonces utilice MSE (Mean Square Error) porque los valores son en tiempo real.

Pero en el caso de los valores discretos (es decir, la clasificación o el uso de agrupación precisa), ya que los valores dados son 0 o 1 solamente. Por lo tanto, aquí el concepto de MSE no se aplicará, en lugar de usar precisión = no de valores de error / valores totales * 100.

Por favor indique la dirección original:red neuronal – ¿Debo usar la pérdida o la precisión como la métrica de detención temprana? - Código de registro