Creación de clústeres de SageMaker HyperPod con plantillas de CloudFormation
Puede crear clústeres de SageMaker HyperPod con las plantillas de CloudFormation para HyperPod. Debe instalar AWS CLI para continuar.
En este tema:
Configuración de recursos en la consola e implementación con CloudFormation
También puede configurar los recursos en la Consola de administración de AWS e implementarlos con plantillas de CloudFormation.
Siga estos pasos.
-
En lugar de elegir Enviar, elija Descargar los parámetros de la plantilla de CloudFormation al final del tutorial en Introducción a SageMaker HyperPod con la consola de SageMaker AI. El tutorial contiene información de configuración importante que necesitará para crear el clúster correctamente.
importante
Si selecciona Enviar, no podrá implementar un clúster con el mismo nombre hasta que lo elimine.
Tras seleccionar Descargar los parámetros de la plantilla de CloudFormation, aparecerá la ventana Uso del archivo de configuración para crear el clúster desde la AWS CLI en la parte derecha de la página.
-
En la ventana Uso del archivo de configuración para crear el clúster desde la AWS CLI, elija Descargar archivo de parámetros de configuración. El archivo se descargará en su equipo. Puede editar el archivo JSON de configuración según sus necesidades o dejarlo como está si no se necesita introducir ningún cambio.
-
En un terminal, vaya a la ubicación del archivo de parámetros
file://params.json. -
Ejecute el comando create-stack de la AWS CLI para implementar la pila de CloudFormation que aprovisionará los recursos configurados y creará el clúster de HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlhttps://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Para ver el estado del aprovisionamiento de recursos, vaya a la consola de CloudFormation
. Después de crear el clúster, visualice el nuevo clúster en Clústeres en el panel principal de la consola de SageMaker HyperPod. También puede consultar su estado en la columna Estado.
-
Cuando el estado del clúster cambie a
InService, puede empezar a iniciar sesión en los nodos del clúster. Para acceder a los nodos del clúster y empezar a ejecutar cargas de trabajo de ML, consulte Trabajos en clústeres de SageMaker HyperPod.
Configuración e implementación de los recursos con CloudFormation
Puede configurar e implementar los recursos con las plantillas de CloudFormation para SageMaker HyperPod.
Siga estos pasos.
-
Descargue una plantilla de CloudFormation para SageMaker HyperPod del repositorio de GitHub sagemaker-hyperpod-cluster-setup
. -
Ejecute el comando create-stack de la AWS CLI para implementar la pila de CloudFormation que aprovisionará los recursos configurados y creará el clúster de HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlURL_of_the_file_that_contains_the_template_body--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Para ver el estado del aprovisionamiento de recursos, vaya a la consola de CloudFormation.
Después de crear el clúster, visualice el nuevo clúster en Clústeres en el panel principal de la consola de SageMaker HyperPod. También puede consultar su estado en la columna Estado.
-
Cuando el estado del clúster cambie a
InService, puede empezar a iniciar sesión en los nodos del clúster.