AMI de Amazon SageMaker HyperPod
Las Imágenes de máquina de Amazon (AMI) de Amazon SageMaker HyperPod son imágenes de máquinas especializadas para cargas de trabajo de machine learning distribuidas y de computación de alto rendimiento. Estas AMI mejoran las imágenes básicas con componentes esenciales, como los controladores de GPU y la compatibilidad con el acelerador AWS Neuron.
Los componentes clave que se han añadido a las AMI de HyperPod son:
-
AMI públicas que permiten crear AMI personalizadas
-
Herramientas de orquestación avanzadas:
-
Dependencias de administración de clústeres
-
Características de resiliencia integradas:
-
Comprobación de estado del clúster
-
Capacidades de reanudación automática
-
-
Compatibilidad con la administración y la configuración de clústeres de HyperPod
Estas mejoras se basan en las siguientes AMI de aprendizaje profundo (DLAMI) básicas:
-
AWS Deep Learning Base GPU AMI (Ubuntu 20.04)
para la orquestación con Slurm. -
AMI basada en Amazon Linux 2 o Amazon Linux 2023 para la orquestación con Amazon EKS.
Elija las AMI de HyperPod en función de sus preferencias de orquestación:
-
Para la orquestación de Slurm, consulte Versiones de la AMI de SageMaker HyperPod para Slurm.
-
Para la orquestación de Amazon EKS, consulte Versiones de la AMI de SageMaker HyperPod para Amazon EKS.
Para obtener más información sobre las versiones de las características de Amazon SageMaker HyperPod, consulte Notas de la versión de Amazon SageMaker HyperPod.