Profileur Amazon SageMaker - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Profileur Amazon SageMaker

Le profileur Amazon SageMaker est actuellement en version préliminaire et disponible gratuitement dans les Régions AWS prises en charge. La version généralement disponible du profileur Amazon SageMaker (le cas échéant) peut inclure des fonctionnalités et des tarifs différents de ceux proposés en version préliminaire.

Le profileur Amazon SageMaker est une fonction d’Amazon SageMaker AI qui fournit une vue détaillée des ressources de calcul AWS provisionnées lors de l’entraînement de modèles de deep learning sur SageMaker. Il se concentre sur le profilage de l’utilisation des CPU et des GPU, les exécutions de noyaux sur les GPU, les lancements du noyau sur les CPU, les opérations de synchronisation, les opérations de mémoire entre les CPU et les GPU, les latences entre les lancements du noyau et les exécutions correspondantes et le transfert de données entre les CPU et les GPU. Le profileur SageMaker propose également une interface utilisateur (UI) qui permet de visualiser le profil, un résumé statistique des événements profilés et la chronologie d’une tâche d’entraînement afin de suivre et de comprendre la relation temporelle des événements entre les GPU et les CPU.

Note

Le profileur SageMaker prend en charge PyTorch et TensorFlow et est disponible dans Conteneurs AWS Deep Learning pour SageMaker AI. Pour en savoir plus, consultez Images de cadre, Régions AWS et types d’instances pris en charge.

Pour les scientifiques des données

L’entraînement de modèles de deep learning sur un grand cluster de calcul pose souvent des problèmes d’optimisation du calcul, tels que des goulots d’étranglement, des latences de lancement du noyau, des limites de mémoire et une faible utilisation des ressources.

Pour identifier ces problèmes de performances de calcul, vous devez approfondir le profil des ressources de calcul afin de comprendre quels noyaux sont à l’origine de latences et quelles opérations sont à l’origine de goulots d’étranglement. Les scientifiques des données peuvent tirer parti de l’interface utilisateur du profileur SageMaker pour visualiser le profil détaillé des tâches d’entraînement. L’interface utilisateur fournit un tableau de bord avec des graphiques récapitulatifs et une interface chronologique pour suivre chaque événement sur les ressources de calcul. Les scientifiques des données peuvent également ajouter des annotations personnalisées pour suivre certaines parties de la tâche d’entraînement à l’aide des modules Python du profileur SageMaker.

Pour les administrateurs

Sur la page d’accueil du profileur dans la console SageMaker AI ou le domaine SageMaker AI, vous pouvez gérer les utilisateurs de l’application Profileur si vous êtes administrateur d’un compte AWS ou d’un domaine SageMaker AI. Chaque utilisateur de domaine peut accéder à sa propre application Profileur avec les autorisations accordées. En tant qu’administrateur de domaine et utilisateur de domaine SageMaker AI, vous pouvez créer et supprimer l’application Profileur en fonction du niveau d’autorisation dont vous disposez.