Variabili di ambiente SageMaker AI e percorsi predefiniti per le posizioni di archiviazione dell’addestramento

La tabella seguente riassume i percorsi di input e output per set di dati di addestramento, checkpoint, artefatti del modello e output, gestiti dalla piattaforma di addestramento SageMaker.

Percorso locale nell'istanza di addestramento SageMaker	Variabile di ambiente SageMaker AI	Scopo	Legge da S3 durante l'avvio	Legge da S3 durante il riavvio tramite SPOT	Scrive su S3 durante l'addestramento	Scrive su S3 quando il processo viene terminato
`/opt/ml/input/data/channel_name`¹	SM_CHANNEL_`CHANNEL_NAME`	Lettura dei dati di addestramento dai canali di input specificati tramite la classe dello strumento di stima SageMaker AI Python SDK o l’operazione API CreateTrainingJob. Per ulteriori informazioni su come specificarlo nello script di addestramento utilizzando l'SDK Python SageMaker, consulta Preparare uno script di addestramento.	Sì	Sì	No	No
`/opt/ml/output/data`²	SM_OUTPUT_DIR	Salvataggio di output come perdita, precisione, strati intermedi, pesi, gradienti, polarizzazione e output compatibili con TensorBoard. Puoi anche salvare qualsiasi output arbitrario che desideri utilizzando questo percorso. Nota che questo è un percorso diverso da quello per l’archiviazione dell'artefatto finale del modello `/opt/ml/model/`.	No	No	No	Sì
`/opt/ml/model`³	SM_MODEL_DIR	Archiviazione dell'artefatto finale del modello. Questo è anche il percorso da cui inizia l’implementazione dell’artefatto del modello per l’inferenza in tempo reale nell’hosting SageMaker AI.	No	No	No	Sì
`/opt/ml/checkpoints`⁴	-	Salvataggio dei checkpoint del modello (lo stato del modello) per riprendere l'addestramento da un determinato punto e riprendersi da interruzioni di Addestramento spot gestite o impreviste.	Sì	Sì	Sì	No
`/opt/ml/code`	SAGEMAKER_SUBMIT_DIRECTORY	Copiare script di addestramento, librerie aggiuntive e dipendenze.	Sì	Sì	No	No
`/tmp`	-	Lettura o scrittura su `/tmp` come spazio da zero.	No	No	No	No

¹ channel_name è il posto in cui specificare i nomi dei canali definiti dall'utente per l'input dei dati di addestramento. Ogni processo di addestramento può contenere diversi canali di immissione dei dati. Puoi specificare fino a un massimo di 20 canali di input di addestramento per ciascun processo di addestramento. Tieni presente che il tempo di download dei dati dai canali di dati viene conteggiato per il tempo fatturabile. Per ulteriori informazioni sui percorsi di input dei dati, consulta Come Amazon SageMaker AI fornisce informazioni sull’addestramento. Inoltre, SageMaker AI supporta tre tipi di modalità di input dei dati: File, FastFile e Pipe. Per ulteriori informazioni sulle modalità di immissione dei dati per l’addestramento in SageMaker AI, consulta Accesso ai dati di addestramento.

² SageMaker AI comprime e scrive artefatti di addestramento in file TAR (tar.gz). Il tempo di compressione e caricamento viene conteggiato nel tempo fatturabile. Per ulteriori informazioni, consulta Come Amazon SageMaker AI elabora l’output di addestramento.

³ SageMaker AI comprime e scrive l’artefatto del modello finale in un file TAR (tar.gz). Il tempo di compressione e caricamento viene conteggiato nel tempo fatturabile. Per ulteriori informazioni, consulta Come Amazon SageMaker AI elabora l’output di addestramento.

⁴ Sincronizzazione con Amazon S3 durante l'addestramento. Scrivi così com'è senza comprimerlo in file TAR. Per ulteriori informazioni, consulta Utilizzo dei checkpoint in Amazon SageMaker AI.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Gestione dei percorsi di archiviazione per diversi tipi di archiviazione locale delle istanze

Cluster eterogenei