Durchsuchen von Checkpoint-Dateien - Amazon SageMaker AI

Durchsuchen von Checkpoint-Dateien

Suchen Sie Checkpoint-Dateien mit dem SageMaker Python SDK und der Amazon S3-Konsole.

Um die Checkpoint-Dateien programmgesteuert zu finden

Um den S3-Bucket-URI abzurufen, in dem die Checkpoints gespeichert sind, überprüfen Sie das folgende Estimator-Attribut:

estimator.checkpoint_s3_uri

Dadurch wird der S3-Ausgabepfad für Checkpoints zurückgegeben, die bei der CreateTrainingJob-Anforderung konfiguriert wurden. Gehen Sie wie folgt vor, um die gespeicherten Checkpoint-Dateien mit der S3-Konsole zu finden.

So finden Sie die Checkpoint-Dateien auf der S3-Konsole
  1. Melden Sie sich bei der AWS-Managementkonsole an und öffnen Sie die SageMaker-AI-Konsole unter https://console.aws.amazon.com/sagemaker/.

  2. Wählen Sie im linken Navigationsbereich die Option Trainingsaufträge.

  3. Wählen Sie den Link zu dem Trainingsjob mit aktiviertem Checkpointing, um die Jobeinstellungen zu öffnen.

  4. Suchen Sie auf der Seite mit den Jobeinstellungen des Trainingsjobs den Abschnitt Checkpoint-Konfiguration.

    Abschnitt zur Checkpoint-Konfiguration auf der Seite mit den Jobeinstellungen eines Trainingsjobs.
  5. Verwenden Sie den Link zum S3-Bucket, um auf die Checkpoint-Dateien zuzugreifen.