Recupero dei dettagli del cluster SageMaker HyperPod - Amazon SageMaker AI

Recupero dei dettagli del cluster SageMaker HyperPod

Scopri come recuperare i dettagli del cluster SageMaker HyperPod con la AWS CLI.

Descrizione di un cluster

Esegui describe-cluster per verificare lo stato del cluster. Puoi specificare il nome o l’ARN del cluster.

aws sagemaker describe-cluster --cluster-name your-hyperpod-cluster

Quando lo stato del cluster diventa InService, procedi con la fase successiva. Utilizzando questa API, puoi anche recuperare i messaggi di errore eseguendo altre operazioni dell’API HyperPod.

Elenco dei dettagli dei nodi del cluster

Esegui list-cluster-nodes per controllare le informazioni chiave dei nodi del cluster.

aws sagemaker list-cluster-nodes --cluster-name your-hyperpod-cluster

Questo restituisce una risposta e InstanceId è ciò che ti serve per l’accesso (con aws ssm).

Descrizione dei dettagli di un nodo del cluster

Esegui describe-cluster-node per recuperare i dettagli di un nodo del cluster. Puoi ottenere l’ID del nodo del cluster dall’output di list-cluster-nodes. Puoi specificare il nome o l’ARN del cluster.

aws sagemaker describe-cluster-node \ --cluster-name your-hyperpod-cluster \ --node-id i-111222333444555aa

Elenco dei cluster

Esegui list-clusters per elencare tutti i cluster del tuo account.

aws sagemaker list-clusters

Puoi anche aggiungere ulteriori flag per filtrare l’elenco dei cluster. Per ulteriori informazioni su cosa viene eseguito a basso livello da questo comando e sui flag aggiuntivi per il filtraggio, consulta la documentazione di riferimento dell’API per ListClusters.