Formato di file di manifesto aumentato per l’addestramento in modalità Pipe - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Formato di file di manifesto aumentato per l’addestramento in modalità Pipe

Il formato di manifest aumentato ti consente di eseguire l’addestramento in modalità Pipe usando i file senza dover creare file RecordIO. È necessario specificare i canali di addestramento e di convalida come valori per il parametro InputDataConfig della richiesta CreateTrainingJob. I file manifest aumentati sono supportati solo per i canali che utilizzano la modalità di input Pipe. Per ogni canale, i dati vengono estratti dal relativo file manifest aumentato e trasmessi (in ordine) all'algoritmo attraverso la named pipe del canale. La modalità Pipe utilizza il metodo FIFO (first-in-first-out), quindi i record vengono elaborati nell'ordine di accodamento. Per informazioni sulla modalità di input Pipe, consulta Input Mode.

I nomi degli attributi con un suffisso "-ref" puntano a dati binari preformattati. In alcuni casi, l'algoritmo sa come analizzare i dati. In altri casi, può essere necessario organizzare i dati in modo che i record vengano delimitati per l'algoritmo. Se l'algoritmo è compatibile con i dati in formato RecordIO, se specifichi RecordIO per RecordWrapperType il problema viene risolto. Se l'algoritmo non è compatibile con il formato RecordIO, specifica None per RecordWrapperType e verifica che i dati vengano analizzati in modo corretto per l'algoritmo.

Se utilizzi l'esempio ["image-ref", "is-a-cat"] e il wrapping RecordIO, il seguente flusso di dati viene inviato alla coda:

recordio_formatted(s3://amzn-s3-demo-bucket/foo/image1.jpg)recordio_formatted("1")recordio_formatted(s3://amzn-s3-demo-bucket/bar/image2.jpg)recordio_formatted("0")

Se alle immagini non è applicato il formato RecordIO, vengono trasmesse come singolo record con il valore dell'attributo is-a-cat corrispondente. Questo può causare un problema perché l'algoritmo potrebbe non delimitare correttamente le immagini e gli attributi. Per ulteriori informazioni sull'utilizzo dei file manifest aumentati per la classificazione delle immagini, consulta Addestramento con il formato di immagine manifest aumentato.

Con i file manifest aumentati e la modalità Pipe in generale, i limiti delle dimensioni del volume EBS non si applicano. Ciò include le impostazioni che devono altrimenti essere comprese nei limiti delle dimensioni del volume EBS, come S3DataDistributionType . Per ulteriori informazioni sulla modalità Pipe e su come utilizzarla, consulta Utilizzo degli algoritmi di addestramento personalizzati - Configurazione dei dati di input.