Contrôleur de tableau de bord d'Amazon SageMaker Debugger Insights
Il existe différents composants du contrôleur Debugger pour la surveillance et le profilage. Dans ce guide, vous allez découvrir les composants du contrôleur Debugger.
Note
Le tableau de bord de SageMaker Debugger Insights exécute une application Studio Classic sur une instance ml.m5.4xlarge pour traiter et restituer les visualisations. Chaque onglet SageMaker Debugger Insights exécute une session de noyau Studio Classic. Plusieurs sessions de noyau pour plusieurs onglets SageMaker Debugger Insights s'exécutent sur une seule instance. Lorsque vous fermez un onglet SageMaker Debugger Insights, la session de noyau correspondante se ferme également. L’application Studio Classic reste active et accumule des frais pour l’utilisation de l’instance ml.m5.4xlarge. Pour plus d'informations sur la tarification, consultez la page Tarification d'Amazon SageMaker
Important
Lorsque vous avez terminé d'utiliser le tableau de bord de SageMaker Debugger Insights, arrêtez l'instance ml.m5.4xlarge pour éviter l'accumulation de frais. Pour plus d'informations sur la façon d'arrêter une instance, consultez Arrêt de l'instance Amazon SageMaker Debugger Insights.
Interface utilisateur du contrôleur SageMaker Debugger Insights
À l'aide du contrôleur Debugger situé en haut à gauche du tableau de bord Insights, vous pouvez actualiser le tableau de bord, configurer ou mettre à jour les paramètres Debugger pour surveiller les métriques système, arrêter la tâche d'entraînement et télécharger le rapport de profilage Debugger.
-
Si vous souhaitez actualiser manuellement le tableau de bord, choisissez le bouton d'actualisation (la flèche arrondie en haut à gauche) comme indiqué dans la capture d'écran précédente.
-
Le bouton Surveillance est activé par défaut pour toutes les tâches d'entraînement SageMaker initiés avec le kit SageMaker Python SDK. S'il n'est pas activé, vous pouvez utiliser le bouton à bascule pour démarrer la surveillance. Pendant la surveillance, Debugger collecte uniquement les métriques d'utilisation des ressources pour détecter les problèmes de calcul, tels que les goulets d'étranglement du CPU et la sous-utilisation du GPU. Pour obtenir la liste complète des problèmes d’utilisation des ressources que Debugger surveille, consultez Règles intégrées à Debugger pour le profilage de l’utilisation des ressources matérielles du système (métriques système).
-
Le bouton Configurer la surveillance ouvre une fenêtre contextuelle que vous pouvez utiliser pour définir ou mettre à jour la fréquence de collecte des données et le chemin S3 pour enregistrer les données.
Vous pouvez spécifier des valeurs pour les champs suivants.
-
S3 bucket URI (URI du compartiment S3) : spécifiez l'URI du compartiment S3 de base.
-
Collect monitoring data every (Collecter les données de surveillance toutes les) : sélectionnez un intervalle de temps pour la collecte des métriques système. Vous pouvez choisir un intervalle de surveillance dans la liste déroulante. Les intervalles disponibles sont 100 millisecondes, 200 millisecondes, 500 millisecondes (par défaut), 1 seconde, 5 secondes et 1 minute.
Note
Si vous choisissez l'un des intervalles les plus courts, vous augmentez la granularité des métriques d'utilisation des ressources, ce qui vous permet de capturer les pics et les anomalies avec une résolution temporelle plus élevée. Toutefois, plus la résolution est élevée, plus la taille des métriques système à traiter est importante. Cela peut entraîner des frais supplémentaires et avoir un impact sur le temps global d'entraînement et de traitement.
-
-
À l'aide du bouton Arrêter l'entraînement, vous pouvez arrêter la tâche d'entraînement lorsque vous constatez des anomalies dans l'utilisation des ressources.
-
À l'aide du bouton Télécharger le rapport, vous pouvez télécharger un rapport de profilage agrégé en ajoutant la règle ProfilerReport intégrée de SageMaker Debugger. Le bouton est activé lorsque vous ajoutez la règle ProfilerReport intégrée à l'estimateur. Pour plus d'informations, consultez Configuration des règles de profilage intégrées et Rapport de profilage généré à l'aide de SageMaker Debugger.