Mappatura dei percorsi di archiviazione per l’addestramento gestiti da Amazon SageMaker AI - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Mappatura dei percorsi di archiviazione per l’addestramento gestiti da Amazon SageMaker AI

Questa pagina fornisce un riepilogo approfondito di come la piattaforma di addestramento SageMaker gestisce i percorsi di archiviazione per set di dati di addestramento, artefatti del modello, checkpoint e output tra l’archiviazione cloud AWS e i job di addestramento in SageMaker AI. Grazie a questa guida, imparerai a identificare i percorsi predefiniti impostati dalla piattaforma SageMaker AI e a semplificare i canali dati con le tue origini dati in Amazon Simple Storage Service (Amazon S3), FSx per Lustre e Amazon EFS. Per ulteriori informazioni sulle diverse classi di input e sulle classi di storage dei canali dati, consulta Configurazione di job di addestramento per accedere ai set di dati.

Panoramica della modalità di mappatura dei percorsi di archiviazione da parte di SageMaker AI

Il diagramma seguente mostra un esempio di come SageMaker AI associa i percorsi di input e output quando si esegue un job di addestramento utilizzando la classe Estimator di SageMaker Python SDK.

Esempio di come SageMaker AI esegue la mappatura dei percorsi tra il container del job di addestramento e l’archiviazione quando si esegue un job di addestramento utilizzando la classe dello strumento di stima SageMaker Python SDK e il relativo metodo di adattamento.

SageMaker AI mappa i percorsi di archiviazione tra uno archivio (come Amazon S3, Amazon FSx e Amazon EFS) e il container di addestramento di SageMaker in base ai percorsi e alla modalità di input specificati tramite un oggetto di stima SageMaker AI. Per ulteriori informazioni su come SageMaker AI legge o scrive sui percorsi e sullo scopo dei percorsi, consulta Variabili di ambiente SageMaker AI e percorsi predefiniti per le posizioni di archiviazione dell’addestramento.

Puoi utilizzare OutputDataConfig nell’API CreateTrainingJob per salvare i risultati dell’addestramento del modello in un bucket S3. Utilizza l’API ModelArtifacts per individuare il bucket S3 che contiene gli artefatti del modello. Consulta il notebook abalone_build_train_deploy per un esempio di percorsi di output e di come vengono utilizzati nelle chiamate API.

Per ulteriori informazioni ed esempi su come SageMaker AI gestisce l’origine dati, le modalità di input e i percorsi locali nelle istanze di addestramento SageMaker, consulta Accesso ai dati di addestramento.