Amazon SageMaker Debugger
Déboguez les tenseurs de sortie des modèles issus de tâches d'entraînement de machine learning en temps réel et détectez les problèmes non convergents à l'aide d'Amazon SageMaker Debugger.
Caractéristiques Amazon SageMaker Debugger
Une tâche d'entraînement de machine learning (ML) peut présenter des problèmes tels que des surajustements, la saturation des fonctions d'activation et la disparition des gradients, qui peuvent compromettre les performances du modèle.
SageMaker Debugger fournit des outils permettant de déboguer des tâches d'entraînement et de résoudre ces problèmes afin d'améliorer les performances de votre modèle. Debugger propose également des outils permettant d'envoyer des alertes lorsque des anomalies d'entraînement sont détectées, de prendre des mesures contre les problèmes et d'en identifier la cause racine en visualisant les métriques et les tenseurs collectés.
SageMaker Debugger prend en charge les frameworks Apache MXNet, PyTorch, TensorFlow et XGBoost. Pour plus d'informations sur les frameworks et les versions disponibles prises en charge par SageMaker Debugger, consultez Cadres et algorithmes pris en charge.
Voici le flux de travail à haut niveau de Debugger :
-
Modifiez votre script d'entraînement à l'aide du kit SDK Python pour
sagemaker-debugger, si nécessaire. -
Configurez une tâche d'entraînement SageMaker avec SageMaker Debugger.
-
Configurez à l’aide de l’API SageMaker AI Estimator (pour le kit SDK Python).
-
Configuration à l’aide de la demande
CreateTrainingJob(pour Boto3 ou la CLI) SageMaker AI. -
Configurez des conteneurs d'entraînement personnalisés avec SageMaker Debugger.
-
-
Démarrez une tâche d'entraînement et contrôlez les problèmes d'entraînement en temps réel.
-
Recevez des alertes et prenez des mesures rapides contre les problèmes d'entraînement.
-
Recevez des textes et des e-mails et arrêtez les tâches d'entraînement lorsque des problèmes d'entraînement sont détectés à l'aide des Utilisation des actions intégrées Debugger pour les règles.
-
Configurez vos propres actions à l'aide d'Amazon CloudWatch Events et d'AWS Lambda.
-
-
Examinez l'analyse approfondie des problèmes d'entraînement.
-
Pour le débogage des tenseurs de sortie de modèle, consultez Visualiser les tenseurs de sortie Debugger dans TensorBoard.
-
-
Corrigez les problèmes en tenant compte des suggestions fournies par Debugger et répétez les étapes 1 à 5 pour optimiser votre modèle jusqu'à atteindre la précision souhaitée.
Le Guide du développeur SageMaker Debugger vous guide à travers les rubriques suivantes.