Zuordnung von Trainingsspeicherpfaden, die von Amazon SageMaker AI verwaltet werden - Amazon SageMaker AI

Zuordnung von Trainingsspeicherpfaden, die von Amazon SageMaker AI verwaltet werden

Diese Seite bietet eine allgemeine Zusammenfassung darüber, wie die SageMaker-AI-Trainingsplattform Speicherpfade für Trainingsdatensätze, Modellartefakte, Checkpoints und Ausgaben zwischen AWS Cloud-Speicher und Trainingsjobs in SageMaker AI verwaltet. In diesem Handbuch erfahren Sie, wie Sie die von der SageMaker-AI-Plattform festgelegten Standardpfade identifizieren und erfahren, wie die Datenkanäle mit Ihren Datenquellen in Amazon Simple Storage Service (Amazon S3), FSx für Lustre und Amazon EFS optimiert werden können. Weitere Informationen zu verschiedenen Datenkanal-Eingabemodi und Speicherungsoptionen finden Sie unter Einrichtung von Trainingsjobs für den Zugriff auf Datensätze.

Überblick über die Zuordnung von Speicherpfaden in SageMaker AI

Das folgende Diagramm zeigt ein Beispiel dafür, wie SageMaker AI Eingabe- und Ausgabepfade zuordnet, wenn Sie einen Trainingsjob mit der Schätzerklasse des SageMaker Python SDK ausführen.

Ein Beispiel dafür, wie SageMaker AI Pfade zwischen dem Trainingsjob-Container und dem Speicher zuordnet, wenn Sie einen Trainingsjob mit der Schätzerklasse des SageMaker Python SDK und der Fit-Methode ausführen

SageMaker AI ordnet Speicherpfade zwischen einem Speicher (wie Amazon S3, Amazon FSx und Amazon EFS) und dem SageMaker-Trainingscontainer auf der Grundlage der Pfade und des Eingabemodus zu, die durch ein SageMaker-AI-Schätzerobjekt angegeben wurden. Weitere Informationen darüber, wie SageMaker AI aus den Pfaden liest oder in die Pfade schreibt und welchen Zweck die Pfade haben, finden Sie unter SageMaker-AI-Umgebungsvariablen und Standardpfade für Trainingsspeicherorte.

Sie können OutputDataConfig in der CreateTrainingJob-API verwenden, um die Ergebnisse des Modelltrainings in einem S3-Bucket zu speichern. Verwenden Sie die ModelArtifacts-API, um den S3-Bucket zu finden, der Ihre Modellartefakte enthält. Ein Beispiel für Ausgabepfade und deren Verwendung in API-Aufrufen finden Sie im Notebook abalone_build_train_deploy.

Weitere Informationen und Beispiele dafür, wie SageMaker AI die Datenquelle, Eingabemodi und lokale Pfade in den Trainings-Instances von SageMaker AI verwaltet, finden Sie unter Zugriff auf Trainingsdaten.