Generador de perfiles de Amazon SageMaker
|
Generador de perfiles de Amazon SageMaker se encuentra en versión de previsualización y está disponible de forma gratuita si Regiones de AWS es compatible. La versión general de Generador de perfiles de Amazon SageMaker (si existe) puede incluir características y precios diferentes a los que se ofrecen en la versión preliminar. |
Generador de perfiles de Amazon SageMaker es una capacidad de Amazon SageMaker AI que proporciona una vista detallada de los recursos de computación de AWS aprovisionados durante el entrenamiento de modelos de aprendizaje profundo en SageMaker AI. Se centra en perfilar el uso de la CPU y la GPU, la ejecución del kernel en las GPU, el lanzamiento del kernel en las CPU, las operaciones de sincronización, las operaciones de memoria entre las CPU y las GPU, las latencias entre los lanzamientos del kernel y las ejecuciones correspondientes, y la transferencia de datos entre las CPU y las GPU. Generador de perfiles de SageMaker también ofrece una interfaz de usuario (UI) que visualiza el perfil, un resumen estadístico de los eventos perfilados y la cronología de un trabajo de entrenamiento para hacer el seguimiento y comprender la relación temporal de los eventos entre las GPU y las CPU.
nota
Generador de perfiles de SageMaker es compatible con PyTorch y TensorFlow y está disponible en contenedores de aprendizaje profundo de AWS para SageMaker AI
Para científicos de datos
El entrenamiento de modelos de aprendizaje profundo en un clúster de computación grande suele tener problemas de optimización computacional, como cuellos de botella, latencias de lanzamiento del kernel, límite de memoria y bajo consumo de recursos.
Para identificar estos problemas de rendimiento computacional, es necesario analizar más a fondo los recursos de computación para comprender qué kernels introducen latencias y qué operaciones provocan cuellos de botella. Los científicos de datos pueden aprovechar la interfaz de usuario de Generador de perfiles de SageMaker para visualizar el perfil detallado de los trabajos de entrenamiento. La interfaz de usuario proporciona un panel de control con gráficos resumidos y una interfaz de cronograma para realizar un seguimiento de todos los eventos de los recursos de computación. Los científicos de datos también pueden añadir anotaciones personalizadas para realizar un seguimiento de determinadas partes del trabajo de entrenamiento mediante los módulos Python de Generador de perfiles de SageMaker.
Para administradores
A través de la página de inicio del generador de perfiles en la consola de SageMaker AI o en el dominio de SageMaker AI, puede administrar los usuarios de la aplicación Generador de perfiles si es administrador de una cuenta de AWS del dominio de SageMaker AI. Cada usuario de dominio puede acceder a su propia aplicación Generador de perfiles con los permisos concedidos. Como administrador y el usuario del dominio de SageMaker AI, puede crear y eliminar la aplicación Generador de perfiles según el nivel de permisos del que disponga.