Recupero dei dettagli del cluster SageMaker HyperPod
Scopri come recuperare i dettagli del cluster SageMaker HyperPod con la AWS CLI.
Descrizione di un cluster
Esegui describe-cluster per verificare lo stato del cluster. Puoi specificare il nome o l’ARN del cluster.
aws sagemaker describe-cluster --cluster-nameyour-hyperpod-cluster
Quando lo stato del cluster diventa InService, procedi con la fase successiva. Utilizzando questa API, puoi anche recuperare i messaggi di errore eseguendo altre operazioni dell’API HyperPod.
Elenco dei dettagli dei nodi del cluster
Esegui list-cluster-nodes per controllare le informazioni chiave dei nodi del cluster.
aws sagemaker list-cluster-nodes --cluster-nameyour-hyperpod-cluster
Questo restituisce una risposta e InstanceId è ciò che ti serve per l’accesso (con aws ssm).
Descrizione dei dettagli di un nodo del cluster
Esegui describe-cluster-node per recuperare i dettagli di un nodo del cluster. Puoi ottenere l’ID del nodo del cluster dall’output di list-cluster-nodes. Puoi specificare il nome o l’ARN del cluster.
aws sagemaker describe-cluster-node \ --cluster-nameyour-hyperpod-cluster\ --node-idi-111222333444555aa
Elenco dei cluster
Esegui list-clusters per elencare tutti i cluster del tuo account.
aws sagemaker list-clusters
Puoi anche aggiungere ulteriori flag per filtrare l’elenco dei cluster. Per ulteriori informazioni su cosa viene eseguito a basso livello da questo comando e sui flag aggiuntivi per il filtraggio, consulta la documentazione di riferimento dell’API per ListClusters.