Actions sur les règles à l’aide d’Amazon CloudWatch et d’AWS Lambda
Amazon CloudWatch collecte les journaux des tâches d’entraînement des modèles Amazon SageMaker AI et ceux des tâches de traitement des règles Amazon SageMaker Debugger. Configurez Debugger avec Amazon CloudWatch Events et AWS Lambda pour effectuer une action en fonction du statut d'évaluation de la règle Debugger.
Exemples de blocs-notes
Vous pouvez exécuter les exemples de blocs-notes suivants, conçus pour tester l’arrêt d’une tâche d’entraînement avec des actions sur les règles intégrées Debugger à l’aide d’Amazon CloudWatch et d’AWS Lambda.
-
Amazon SageMaker Debugger - Réagir aux événements CloudWatch Events à partir des règles
Cet exemple de bloc-notes exécute une tâche d'entraînement qui présente un problème de disparition de gradient. La règle Debugger intégrée VanishingGradient est utilisée lors de la construction de l’estimateur TensorFlow SageMaker AI. Lorsque la règle Debugger détecte le problème, la tâche d'entraînement est interrompue.
-
Détecter l'entraînement bloqué et appeler des actions à l'aide de la règle Debugger SageMaker
Cet exemple de bloc-notes exécute un script d'entraînement avec une ligne de code qui le force à rester en veille pendant 10 minutes. La règle intégrée StalledTrainingRrule de Debugger invoque des problèmes et arrête la tâche d'entraînement.