Reprise de l’entraînement à partir d’un point de contrôle - Amazon SageMaker AI

Reprise de l’entraînement à partir d’un point de contrôle

Pour reprendre une tâche d’entraînement à partir d’un point de contrôle, exécutez un nouvel estimateur avec le même checkpoint_s3_uri que celui créé dans la section Activation de la création de points de contrôle. Une fois que l’entraînement a repris, les points de contrôle de ce compartiment S3 sont restaurés au checkpoint_local_path dans chaque instance de la nouvelle tâche d’entraînement. Assurez-vous que le compartiment S3 se trouve dans la même région que celle de la session SageMaker AI actuelle.

Diagramme d’architecture de synchronisation des points de contrôle pour reprendre l’entraînement.