Utilisation des règles intégrées Debugger avec les paramètres par défaut - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation des règles intégrées Debugger avec les paramètres par défaut

Pour spécifier des règles intégrées de Debugger dans un estimateur, vous devez configurer un objet de liste . L'exemple de code suivant présente la structure de base permettant de répertorier les règles intégrées de Debugger :

from sagemaker.debugger import Rule, rule_configs rules=[ Rule.sagemaker(rule_configs.built_in_rule_name_1()), Rule.sagemaker(rule_configs.built_in_rule_name_2()), ... Rule.sagemaker(rule_configs.built_in_rule_name_n()), ... # You can also append more profiler rules in the ProfilerRule.sagemaker(rule_configs.*()) format. ]

Pour plus d’informations sur les valeurs de paramètres par défaut et les descriptions de la règle intégrée, consultez Liste des règles intégrées à Debugger.

Pour trouver la référence de l'API SageMaker Debugger, consultez sagemaker.debugger.rule_configs et sagemaker.debugger.Rule.

Par exemple, pour inspecter les performances globales d’entraînement et la progression de votre modèle, construisez un estimateur SageMaker AI avec la configuration de règle intégrée suivante.

from sagemaker.debugger import Rule, rule_configs rules=[ Rule.sagemaker(rule_configs.loss_not_decreasing()), Rule.sagemaker(rule_configs.overfit()), Rule.sagemaker(rule_configs.overtraining()), Rule.sagemaker(rule_configs.stalled_training_rule()) ]

Lorsque vous démarrez la tâche d'entraînement, Debugger collecte les données d'utilisation des ressources système toutes les 500 millisecondes et les valeurs de perte et de précision toutes les 500 étapes par défaut. Debugger analyse l'utilisation des ressources pour identifier si votre modèle rencontre des problèmes de goulet d'étranglement. loss_not_decreasing, overfit, overtraining etstalled_training_rule contrôlent si votre modèle optimise la fonction de perte sans ces problèmes d'entraînement. Si les règles détectent des anomalies d'entraînement, le statut d'évaluation de la règle passe à IssueFound. Vous pouvez configurer des actions automatisées, telles que la notification des problèmes d'entraînement et l'arrêt des tâches d'entraînement, à l'aide d'Amazon CloudWatch Events et de AWS Lambda. Pour plus d'informations, consultez Action sur les règles d'Amazon SageMaker Debugger.