Aktionen für Regeln mit Amazon CloudWatch und AWS Lambda
Amazon CloudWatch sammelt Protokolle für Modelltrainingsjobs von Amazon SageMaker AI und Protokolle für Regelverarbeitungsaufträge von Amazon SageMaker Debugger. Konfigurieren Sie den Debugger mit Amazon CloudWatch Events und AWS Lambda um Maßnahmen auf der Grundlage des Evaluierungsstatus der Debugger-Regel zu ergreifen.
Beispiel-Notebooks
Sie können die folgenden Beispiel-Notebooks ausführen, die darauf vorbereitet sind, mit den Aktionen der integrierten Regeln des Debuggers anhand von Amazon CloudWatch und AWS Lambda zu experimentieren, indem Sie einen Trainingsjob beenden.
-
Amazon SageMaker Debugger – Reagieren auf CloudWatch-Ereignisse anhand von Regeln
In diesem Beispiel-Notebook wird ein Trainingsjob ausgeführt, bei dem ein Problem mit verschwindendem Farbverlauf auftritt. Die VanishingGradient integrierte Debugger-Regel wird bei der Erstellung des Schätzers von SageMaker AI TensorFlow verwendet. Wenn die Debugger-Regel das Problem erkennt, wird der Trainingsjob beendet.
-
Erkennen Sie blockiertes Training und rufen Sie Aktionen mithilfe der SageMaker-Debugger-Regel auf
In diesem Beispiel-Notebook wird ein Trainingsskript mit einer Codezeile ausgeführt, die es zwingt, für 10 Minuten in den Ruhemodus zu wechseln. Die StalledTrainingRule integrierte Debuger-Regel löst Probleme aus und beendet den Trainingsjob.