Reanudación del entrenamiento a partir de un punto de comprobación - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Reanudación del entrenamiento a partir de un punto de comprobación

Para reanudar un trabajo de entrenamiento desde un punto de control, ejecute un nuevo estimador con el mismo checkpoint_s3_uri que creó en la sección Habilitación de puntos de comprobación. Una vez que se haya reanudado el entrenamiento, se restablecerán los puntos de control de este bucket de S3 a checkpoint_local_path en cada instancia del nuevo trabajo de entrenamiento. Compruebe que el bucket de S3 se encuentre en la misma región que la sesión de SageMaker AI en curso.

Diagrama de arquitectura de la sincronización de puntos de control para reanudar el entrenamiento.