Gobernanza de tareas de SageMaker HyperPod - Amazon SageMaker AI

Gobernanza de tareas de SageMaker HyperPod

La gobernanza de tareas de SageMaker HyperPod es un sistema de administración sólido, diseñado para optimizar la asignación de recursos y garantizar un uso eficiente de los recursos de computación en todos los equipos y proyectos dentro de los clústeres de Amazon EKS. Esto brinda a los administradores la capacidad de establecer:

  • Niveles de prioridad para diversas tareas

  • Asignación de computación para cada equipo

  • El modo en que cada equipo presta y utiliza computación inactiva

  • Si un equipo interrumpe o reasigna sus propias tareas

Además, la gobernanza de tareas de HyperPod brinda la capacidad de observabilidad de clústeres de Amazon EKS, que ofrece visibilidad en tiempo real de la capacidad de los clústeres. Esto incluye la disponibilidad y el uso de la computación, la asignación y utilización de los equipos y la información sobre el tiempo de ejecución y espera de las tareas, lo que le permite tomar decisiones fundamentadas y administrar los recursos de forma proactiva.

En las siguientes secciones se describe cómo configurar, comprender conceptos clave y utilizar la gobernanza de tareas de HyperPod para sus clústeres de Amazon EKS.