Configuration du module complémentaire d' SageMaker HyperPodobservabilité - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration du module complémentaire d' SageMaker HyperPodobservabilité

La liste suivante décrit les conditions préalables à la configuration du module complémentaire d’observabilité.

Pour que les statistiques de votre cluster Amazon SageMaker HyperPod (SageMaker HyperPod) soient envoyées à un espace de travail Amazon Managed Service for Prometheus et pour les consulter éventuellement dans Amazon Managed Grafana, associez d'abord les politiques et autorisations gérées suivantes à votre rôle de console.

  • Pour utiliser Amazon Managed Grafana, activez AWS IAM Identity Center (IAM Identity Center) dans un endroit où Région AWS Amazon Managed Grafana est disponible. Pour obtenir des instructions, consultez Premier pas avec IAM Identity Center dans le Guide de l’utilisateur AWS IAM Identity Center. Pour obtenir la liste des Régions AWS où Amazon Managed Grafana est disponible, consultez Régions prises en charge dans le Guide de l’utilisateur Amazon Managed Grafana.

  • Créez au moins un utilisateur dans IAM Identity Center.

  • Assurez-vous que le module complémentaire Agent d’identité du pod Amazon EKS est installé dans votre cluster Amazon EKS. Le module complémentaire Amazon EKS Pod Identity Agent permet au module complémentaire d' SageMaker HyperPod observabilité d'obtenir les informations d'identification nécessaires pour interagir avec Amazon Managed Service for CloudWatch Prometheus and Logs. Pour vérifier si votre cluster Amazon EKS possède le module complémentaire, accédez à la console Amazon EKS et examinez l’onglet Modules complémentaires de votre cluster. Pour en savoir plus sur la manière d’installer le module complémentaire s’il n’est pas installé, consultez Création d’un module complémentaire (AWS Management Console) dans le Guide de l’utilisateur Amazon EKS.

  • Assurez-vous de disposer d'au moins un nœud dans votre SageMaker HyperPod cluster avant d'installer le module complémentaire d' SageMaker HyperPod observabilité. Le plus petit type d' EC2instance Amazon qui fonctionne dans ce cas est4xlarge. Cette exigence de taille de nœud minimale garantit que le nœud peut accueillir tous les pods créés par le module complémentaire d' SageMaker HyperPod observabilité aux côtés de tous les autres pods déjà en cours d'exécution sur le cluster.

  • Ajoutez les politiques et autorisations suivantes à votre rôle.

    • AWSpolitique gérée : AmazonSageMakerHyperPodObservabilityAdminAccess

    • AWSpolitique gérée : AWSGrafana WorkspacePermissionManagement V2

    • AWSpolitique gérée : AmazonSageMakerFullAccess

    • Autorisations supplémentaires pour configurer les rôles IAM requis pour l’accès aux modules complémentaires Amazon Managed Grafana et Amazon Elastic Kubernetes Service :

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] } ] }
    • Autorisations supplémentaires nécessaires pour gérer les utilisateurs d’IAM Identity Center pour Amazon Managed Grafana :

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }

Après avoir vérifié que vous avez rempli les conditions préalables ci-dessus, vous pouvez installer le module complémentaire d’observabilité.

Pour installer rapidement le module complémentaire d’observabilité
  1. Ouvrez la console Amazon SageMaker AI à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Accédez à la page de détails de votre cluster.

  3. Dans l'onglet Tableau de bord, recherchez le module complémentaire HyperPod Monitoring & Observability, puis sélectionnez Installation rapide.

Pour effectuer une installation personnalisée du module complémentaire d’observabilité
  1. Accédez à la page de détails de votre cluster.

  2. Dans l'onglet Tableau de bord, recherchez le module complémentaire HyperPod Monitoring & Observability, puis choisissez Installation personnalisée.

  3. Spécifiez les catégories de métriques que vous souhaitez visualiser. Pour plus d’informations sur ces catégories de métriques, consultez SageMaker HyperPod métriques du cluster.

  4. Spécifiez si vous souhaitez activer Amazon CloudWatch Logs.

  5. Spécifiez si vous souhaitez que le service crée un nouvel espace de travail Service géré Amazon pour Prometheus.

  6. Pour pouvoir visualiser les métriques dans les tableaux de bord Amazon Managed Grafana, cochez la case intitulée Utiliser un espace de travail Grafana géré par Amazon. Vous pouvez spécifier votre propre espace de travail ou laisser le service en créer un nouveau pour vous.

    Note

    Amazon Managed Grafana n'est pas disponible Régions AWS dans toutes les régions où Amazon Managed Service for Prometheus est disponible. Toutefois, vous pouvez configurer un espace de travail Grafana dans n’importe quelle Région AWS et le configurer pour obtenir des données de métriques à partir d’un espace de travail Prometheus situé dans une autre Région AWS. Pour plus d’informations, consultez Utilisation de la configuration de la source de données AWS pour ajouter le service géré Amazon pour Prometheus en tant que source de données et Connexion au service géré Amazon pour Prometheus et aux sources de données open source Prometheus.