Schede HyperPod in Studio
In Amazon SageMaker Studio puoi accedere a uno dei tuoi cluster in Cluster HyperPod (in Calcolo) e visualizzare l’elenco dei cluster. I cluster visualizzati contengono informazioni come attività, metriche hardware, impostazioni e dettagli sui metadati. Questa visibilità può aiutare il team a identificare il candidato giusto per i carichi di lavoro di preaddestramento o di fine-tuning. Nelle sezioni seguenti vengono approfonditi i vari tipi di informazioni.
Attività
Amazon SageMaker HyperPod offre una visualizzazione delle attività del cluster. Le attività sono operazioni o processi che vengono inviati al cluster. Queste possono essere operazioni di machine learning, come addestramento, esecuzione di esperimenti o inferenza. La sezione seguente fornisce informazioni sulle attività del cluster HyperPod.
In Amazon SageMaker Studio, puoi accedere a uno dei tuoi cluster in Cluster HyperPod (in Calcolo) e visualizzare le informazioni sulle attività del cluster. Se riscontri problemi con la visualizzazione delle attività, consulta Risoluzione dei problemi.
La tabella delle attività include:
Metriche
Amazon SageMaker HyperPod fornisce una visualizzazione delle metriche di utilizzo del cluster Slurm o Amazon EKS. Di seguito vengono fornite informazioni sulle metriche del cluster HyperPod.
Devi installare il componente aggiuntivo Amazon EKS per visualizzare le seguenti metriche. Per ulteriori informazioni, consulta Install the Amazon CloudWatch Observability EKS add-on.
In Amazon SageMaker Studio, puoi accedere a uno dei tuoi cluster in Cluster HyperPod (in Calcolo) e visualizzare i dettagli delle metriche sul tuo cluster. In Metriche puoi ottenere una visione completa delle metriche di utilizzo dei cluster, ad esempio quelle relative all’hardware, al team e alle attività. Sono inclusi la disponibilità e l’utilizzo delle risorse di calcolo, l’allocazione e l’utilizzo del team e le informazioni sull’esecuzione delle attività e sui tempi di attesa.
Impostazioni
Amazon SageMaker HyperPod fornisce una visualizzazione delle impostazioni del cluster. Di seguito vengono fornite informazioni sulle impostazioni del cluster HyperPod.
In Amazon SageMaker Studio, puoi accedere a uno dei tuoi cluster in Cluster HyperPod (in Calcolo) e visualizzare le informazioni sulle impostazioni del cluster. Vengono fornite le informazioni seguenti:
-
Dettagli sulle istanze, tra cui ID dell’istanza, stato, tipo di istanza e gruppo di istanze
-
Dettagli sui gruppi di istanze, tra cui nome, tipo, conteggi e informazioni sulle risorse di calcolo
-
Dettagli sull’orchestrazione, inclusi l’orchestratore, la versione e l’autorità di certificazione
-
Dettagli sulla resilienza del cluster
-
Dettagli sulla sicurezza, ad esempio relativi a sottoreti e gruppi di sicurezza
Informazioni
Amazon SageMaker HyperPod fornisce una visualizzazione dei dettagli dei metadati del cluster. Il paragrafo seguente fornisce informazioni su come ottenere i dettagli del cluster HyperPod.
In Amazon SageMaker Studio, puoi accedere a uno dei tuoi cluster in Cluster HyperPod (in Calcolo) e visualizzare i dettagli sul tuo cluster. Questi includono tag, log e metadati.