SageMaker HyperPod gestion des clusters - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

SageMaker HyperPod gestion des clusters

Les rubriques suivantes traitent de la journalisation et de la gestion des SageMaker HyperPod clusters.

Journalisation SageMaker HyperPod des événements

Tous les événements et journaux SageMaker HyperPod sont enregistrés sur Amazon CloudWatch sous le nom du groupe de journaux/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. Chaque appel à l’API CreateCluster crée un nouveau groupe de journaux. La liste suivante contient tous les flux de journaux disponibles collectés dans chaque groupe de journaux.

Nom du groupe de journaux Nom du flux de journaux
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

Journalisation SageMaker HyperPod au niveau de l'instance

Vous pouvez accéder aux LifecycleScript journaux publiés CloudWatch lors de la configuration de l'instance de cluster. Chaque instance de cluster créée génère un flux de journaux distinct, qui se distingue par son format LifecycleConfig/[instance-group-name]/[instance-id].

Tous les journaux écrits /var/log/provision/provisioning.log sont téléchargés dans le CloudWatch flux précédent. LifecycleScripts Échantillonnez lors de la 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configredirection de leur stdout et stderr vers cet emplacement. Si vous utilisez vos scripts personnalisés, rédigez vos journaux à l'/var/log/provision/provisioning.logendroit où ils seront disponibles CloudWatch.

Balisage de ressources

AWSLe système de balisage permet de gérer, d'identifier, d'organiser, de rechercher et de filtrer les ressources. SageMaker HyperPod prend en charge le balisage, afin que vous puissiez gérer les clusters en tant que AWS ressource. Lors de la création ou de la modification d’un cluster existant, vous pouvez ajouter ou modifier des balises pour le cluster. Pour en savoir plus sur le balisage en général, consultez Balisage de vos ressources AWS.

Utilisation de l'interface utilisateur SageMaker HyperPod de la console

Lorsque vous créez un nouveau cluster et modifiez un cluster, vous pouvez ajouter, supprimer ou modifier des balises.

En utilisant le SageMaker HyperPod APIs

Lorsque vous rédigez un fichier de demande d'UpdateClusterAPI CreateClusterou un fichier de demande d'API au format JSON, modifiez la Tags section.

Utilisation des commandes de AWS CLI balisage pour l'IA SageMaker

Pour baliser un cluster

Utilisez aws sagemaker add-tags comme suit.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

Pour supprimer les balises d’un cluster

Utilisez aws sagemaker delete-tags comme suit.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

Pour répertorier les balises d’une ressource

Utilisez aws sagemaker list-tags comme suit.

aws sagemaker list-tags --resource-arn cluster_ARN