Einrichtung des Observability-Add-Ons SageMaker HyperPod - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einrichtung des Observability-Add-Ons SageMaker HyperPod

In der folgenden Liste werden die Voraussetzungen für die Einrichtung des Observability-Add-ons beschrieben.

Um Metriken für Ihren Amazon SageMaker HyperPod (SageMaker HyperPod) -Cluster an einen Amazon Managed Service for Prometheus-Workspace senden zu lassen und sie optional in Amazon Managed Grafana anzuzeigen, fügen Sie Ihrer Konsolenrolle zunächst die folgenden verwalteten Richtlinien und Berechtigungen hinzu.

  • Um Amazon Managed Grafana zu verwenden, aktivieren Sie AWS IAM Identity Center (IAM Identity Center) an einem Ort, an AWS-Region dem Amazon Managed Grafana verfügbar ist. Anweisungen finden Sie unter Erste Schritte mit IAM Identity Center im AWS IAM Identity Center-Benutzerhandbuch. Eine Liste, AWS-Regionen wo Amazon Managed Grafana verfügbar ist, finden Sie unter Unterstützte Regionen im Amazon Managed Grafana-Benutzerhandbuch.

  • Erstellen Sie mindestens einen Benutzer in IAM Identity Center.

  • Stellen Sie sicher, dass das Amazon EKS Pod Identity Agent Add-on in Ihrem Amazon EKS-Cluster installiert ist. Das Amazon EKS Pod Identity Agent-Add-on ermöglicht es dem SageMaker HyperPod Observability-Add-on, die Anmeldeinformationen für die Interaktion mit Amazon Managed Service for Prometheus und Logs abzurufen. CloudWatch Um zu überprüfen, ob Ihr Amazon EKS-Cluster über das Add-on verfügt, rufen Sie die Amazon EKS-Konsole auf und überprüfen Sie den Tab „Add-Ons“ Ihres Clusters. Informationen zur Installation des Add-ons, falls es nicht installiert ist, finden Sie unter Add-on erstellen (AWS-Managementkonsole) im Amazon EKS-Benutzerhandbuch.

  • Stellen Sie sicher, dass Sie mindestens einen Knoten in Ihrem SageMaker HyperPod Cluster haben, bevor Sie das Observability-Add-on installieren SageMaker HyperPod . Der kleinste EC2 Amazon-Instance-Typ, der in diesem Fall funktioniert, ist4xlarge. Diese Mindestanforderung an die Knotengröße stellt sicher, dass der Knoten alle Pods aufnehmen kann, die das SageMaker HyperPod Observability-Add-on zusammen mit allen anderen bereits laufenden Pods auf dem Cluster erstellt.

  • Fügen Sie Ihrer Rolle die folgenden Richtlinien und Berechtigungen hinzu.

    • AWSverwaltete Richtlinie: AmazonSageMakerHyperPodObservabilityAdminAccess

    • AWSverwaltete Richtlinie: V2 AWSGrafana WorkspacePermissionManagement

    • AWSverwaltete Richtlinie: AmazonSageMakerFullAccess

    • Zusätzliche Berechtigungen zum Einrichten der erforderlichen IAM-Rollen für den Add-On-Zugriff auf Amazon Managed Grafana und Amazon Elastic Kubernetes Service:

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] } ] }
    • Zusätzliche Berechtigungen, die zur Verwaltung von IAM Identity Center-Benutzern für Amazon Managed Grafana erforderlich sind:

      JSON
      { "Version":"2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }

Nachdem Sie sichergestellt haben, dass Sie die oben genannten Voraussetzungen erfüllt haben, können Sie das Observability-Add-on installieren.

Um das Observability-Add-on schnell zu installieren
  1. Öffnen Sie die Amazon SageMaker AI-Konsole unter https://console.aws.amazon.com/sagemaker/.

  2. Gehen Sie zur Detailseite Ihres Clusters.

  3. Suchen Sie auf der Registerkarte Dashboard das Add-on mit dem Namen HyperPod Monitoring & Observability und wählen Sie Schnellinstallation aus.

Um eine benutzerdefinierte Installation des Observability-Add-ons durchzuführen
  1. Gehen Sie zur Detailseite Ihres Clusters.

  2. Suchen Sie auf der Registerkarte Dashboard das Add-on mit dem Namen HyperPod Monitoring & Observability und wählen Sie Benutzerdefinierte Installation aus.

  3. Geben Sie die Metrikkategorien an, die Sie einsehen möchten. Weitere Informationen zu diesen Metrikkategorien finden Sie unter SageMaker HyperPod Cluster-Metriken.

  4. Geben Sie an, ob Sie Amazon CloudWatch Logs aktivieren möchten.

  5. Geben Sie an, ob Sie möchten, dass der Service einen neuen Workspace in Amazon Managed Service für Prometheus erstellt.

  6. Um die Metriken in Amazon Managed Grafana-Dashboards anzeigen zu können, aktivieren Sie das Kontrollkästchen Verwenden Sie einen Amazon Managed Grafana-Arbeitsbereich. Sie können Ihren eigenen Arbeitsbereich angeben oder den Service einen neuen für Sie erstellen lassen.

    Anmerkung

    Amazon Managed Grafana ist nicht in allen Ländern verfügbar, AWS-Regionen in denen Amazon Managed Service für Prometheus verfügbar ist. Sie können jedoch in einem beliebigen Grafana-Workspace einen Grafana-Workspace einrichten AWS-Region und ihn so konfigurieren, dass Metrikdaten aus einem Prometheus-Workspace abgerufen werden, der sich in einem anderen befindet. AWS-Region Informationen finden Sie unter AWSDatenquellenkonfiguration verwenden, um Amazon Managed Service für Prometheus als Datenquelle hinzuzufügen und Connect zu Amazon Managed Service für Prometheus und Open-Source-Prometheus-Datenquellen herstellen.