Configurazione della dashboard - Amazon SageMaker AI

Configurazione della dashboard

Utilizza le informazioni seguenti per configurare il componente aggiuntivo Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS. Questo ti offre una dashboard visiva dettagliata che fornisce una panoramica delle metriche relative all’hardware del cluster EKS, all’allocazione dei team e alle attività.

In caso di problemi di configurazione, consulta Risoluzione dei problemi per la risoluzione dei problemi noti.

Prerequisiti del componente aggiuntivo HyperPod Amazon CloudWatch Observability EKS

La sezione seguente include i prerequisiti necessari per installare il componente aggiuntivo Amazon EKS Observability.

  • Assicurati di disporre della policy di autorizzazione minima per gli amministratori del cluster HyperPod, descritta in Utenti IAM per l’amministratore del cluster.

  • Collega una policy CloudWatchAgentServerPolicy IAM ai nodi worker. A questo scopo, immetti il comando seguente. Sostituisci my-worker-node-role con il ruolo IAM utilizzato dai nodi worker Kubernetes.

    aws iam attach-role-policy \ --role-name my-worker-node-role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy

Configurazione del componente aggiuntivo HyperPod Amazon CloudWatch Observability EKS

Utilizza le opzioni seguenti per configurare il componente aggiuntivo Amazon SageMaker HyperPod Amazon CloudWatch Observability EKS.

Setup using the SageMaker AI console

Le autorizzazioni seguenti sono necessarie per configurare e visualizzare la dashboard di governance delle attività di HyperPod. Questa sezione espande le autorizzazioni elencate in Utenti IAM per l’amministratore del cluster.

Per gestire la governance delle attività, utilizza la policy di esempio:

JSON
JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:ListClusters", "sagemaker:DescribeCluster", "sagemaker:ListComputeQuotas", "sagemaker:CreateComputeQuota", "sagemaker:UpdateComputeQuota", "sagemaker:DescribeComputeQuota", "sagemaker:DeleteComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "sagemaker:CreateClusterSchedulerConfig", "sagemaker:UpdateClusterSchedulerConfig", "sagemaker:DeleteClusterSchedulerConfig", "eks:ListAddons", "eks:CreateAddon", "eks:DescribeAddon", "eks:DescribeCluster", "eks:DescribeAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "*" } ] }

Per concedere le autorizzazioni per gestire Amazon CloudWatch Observability Amazon EKS e visualizzare la dashboard del cluster HyperPod tramite la console SageMaker AI, utilizza la policy di esempio seguente:

JSON
JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "eks:ListAddons", "eks:CreateAddon", "eks:UpdateAddon", "eks:DescribeAddon", "eks:DescribeAddonVersions", "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:ListClusters", "sagemaker:ListComputeQuotas", "sagemaker:DescribeComputeQuota", "sagemaker:ListClusterSchedulerConfigs", "sagemaker:DescribeClusterSchedulerConfig", "eks:DescribeCluster", "cloudwatch:GetMetricData", "eks:AccessKubernetesApi" ], "Resource": "*" } ] }

Vai alla scheda Dashboard nella console SageMaker HyperPod per installare Amazon CloudWatch Observability EKS. Per garantire che le metriche relative alla governance delle attività siano incluse nella Dashboard, abilita la casella di controllo delle metriche Kueue. L’abilitazione delle metriche Kueue attiva i costi per le metriche CloudWatch, una volta superato il limite del livello gratuito. Per ulteriori informazioni, consulta la sezione sulle metriche in Prezzi di Amazon CloudWatch.

Setup using the EKS AWS CLI

Utilizza il comando AWS CLI di EKS seguente per installare il componente aggiuntivo:

aws eks create-addon --cluster-name cluster-name --addon-name amazon-cloudwatch-observability --configuration-values "configuration json"

Di seguito è riportato un JSON di esempio con i valori di configurazione:

{ "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } } }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }
Setup using the EKS Console UI
  1. Passa alla console EKS.

  2. Scegli il cluster.

  3. Scegli Componenti aggiuntivi.

  4. Trova il componente aggiuntivo Amazon CloudWatch Observability e installalo. Installa la versione 2.4.0 o superiore per il componente aggiuntivo.

  5. Includi i valori di configurazione JSON seguenti:

    { "agent": { "config": { "logs": { "metrics_collected": { "kubernetes": { "kueue_container_insights": true, "enhanced_container_insights": true }, "application_signals": { } }, }, "traces": { "traces_collected": { "application_signals": { } } } }, }, }

Una volta installato correttamente il componente aggiuntivo EKS Observability, puoi visualizzare le metriche del cluster EKS nella scheda Dashboard della console HyperPod.