Creazione di cluster SageMaker HyperPod con modelli CloudFormation
Puoi creare cluster SageMaker HyperPod utilizzando i modelli CloudFormation per HyperPod. Devi installare AWS CLI per procedere.
In questo argomento:
Configurazione delle risorse nella console e implementazione con CloudFormation
Puoi configurare le risorse utilizzando la Console di gestione AWS e implementarle con i modelli CloudFormation.
Segui questa procedura.
-
Invece di scegliere Invia, scegli Scarica i parametri del modello CloudFormation alla fine del tutorial in Nozioni di base su SageMaker HyperPod con la console SageMaker AI. Il tutorial contiene importanti informazioni di configurazione, necessarie per creare correttamente il cluster.
Importante
Se scegli Invia, non sarai in grado di implementare un cluster con lo stesso nome finché non elimini il cluster.
Dopo aver scelto Scarica i parametri del modello CloudFormation, si apre la finestra Utilizzo del file di configurazione per creare il cluster con la AWS CLI sul lato destro della pagina.
-
Nella finestra Utilizzo del file di configurazione per creare il cluster con la AWS CLI, scegli Scarica il file dei parametri di configurazione. Il file verrà scaricato sul tuo computer. Puoi modificare il file JSON di configurazione in base alle tue esigenze o lasciarlo così com’è, se non sono necessarie modifiche.
-
In un terminale, vai alla posizione del file dei parametri
file://params.json. -
Esegui il comando della AWS CLI create-stack per implementare lo stack CloudFormation che allocherà le risorse configurate e creerà il cluster HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlhttps://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Per visualizzare lo stato del provisioning delle risorse, accedi alla console CloudFormation
. Una volta completata la creazione del cluster, visualizza il nuovo cluster in Cluster nel riquadro principale della console SageMaker HyperPod. Puoi anche controllarne lo stato nella colonna Stato.
-
Quando lo stato del cluster diventa
InService, puoi iniziare ad accedere ai nodi del cluster. Per accedere ai nodi del cluster e iniziare a eseguire carichi di lavoro di ML, consulta Processi sui cluster SageMaker HyperPod.
Configurazione e implementazione delle risorse con CloudFormation
Puoi configurare e implementare le risorse utilizzando i modelli CloudFormation per SageMaker HyperPod.
Segui questa procedura.
-
Scarica un modello CloudFormation per SageMaker HyperPod dal repository GitHub sagemaker-hyperpod-cluster-setup
. -
Esegui il comando della AWS CLI create-stack per implementare lo stack CloudFormation che allocherà le risorse configurate e creerà il cluster HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlURL_of_the_file_that_contains_the_template_body--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Per visualizzare lo stato del provisioning delle risorse, accedi alla console CloudFormation.
Una volta completata la creazione del cluster, visualizza il nuovo cluster in Cluster nel riquadro principale della console SageMaker HyperPod. Puoi anche controllarne lo stato nella colonna Stato.
-
Quando lo stato del cluster diventa
InService, puoi iniziare ad accedere ai nodi del cluster.