Creare un processo di classificazione delle immagini utilizzando l’API AutoML
Le seguenti istruzioni mostrano come creare un processo pilota automatico Amazon SageMaker come esperimento pilota per tipi di problemi di classificazione delle immagini testo utilizzando SageMaker API Reference.
Nota
Attività come la classificazione di testo e immagini, la previsione di serie temporali e il fine-tuning di modelli linguistici di grandi dimensioni sono disponibili esclusivamente tramite la versione 2 della REST API AutoML. Se il linguaggio preferito è Python, è possibile fare riferimento ad AWS SDK per Python (Boto3)
Gli utenti che preferiscono la comodità di un’interfaccia utente possono utilizzare Amazon SageMaker Canvas per accedere a modelli preaddestrati e modelli di fondazione di IA generativa o creare modelli personalizzati su misura per esigenze specifiche di testo, classificazione delle immagini, previsioni o IA generativa.
Puoi creare un esperimento Autopilot per la classificazione delle immagini a livello di programmazione richiamando l'azione dell'API CreateAutoMLJobV2 in qualsiasi linguaggio supportato dal pilota automatico Amazon SageMaker o da AWS CLI.
Per informazioni su come questa azione API si traduce in una funzione nella lingua che preferisci, consulta Vedi anche di CreateAutoMLJobV2 e seleziona un SDK. Ad esempio, per gli utenti di Python, vedi la sintassi completa della richiesta di create_auto_ml_job_v2 in AWS SDK per Python (Boto3).
Di seguito è riportata una raccolta di parametri di richiesta di input obbligatori e facoltativi per l'azione API CreateAutoMLJobV2 utilizzata nella classificazione delle immagini.
Parametri obbligatori
Quando chiami CreateAutoMLJobV2 per creare un esperimento Autopilot per la classificazione delle immagini, devi fornire i seguenti valori:
-
Un
AutoMLJobNameper specificare il nome del processo. -
Almeno un
AutoMLJobChannelinAutoMLJobInputDataConfigper specificare l'origine dati. -
Un
AutoMLProblemTypeConfigdi tipoImageClassificationJobConfig. -
Un
OutputDataConfigper specificare il percorso di output di Amazon S3 per archiviare gli artefatti del processo AutoML. -
Un
RoleArnper specificare l'ARN del ruolo utilizzato per accedere ai dati.
Tutti gli altri parametri sono facoltativi.
Parametri facoltativi
Le sezioni seguenti forniscono dettagli su alcuni parametri opzionali che è possibile passare al processo AutoML di classificazione delle immagini.
È possibile fornire il proprio set di dati di convalida e un rapporto di suddivisione dei dati personalizzato oppure lasciare che Autopilot suddivida automaticamente il set di dati.
Ogni oggetto AutoMLJobChannel (vedi il parametro richiesto AutoMLJobInputDataConfig) ha un ChannelType, che può essere impostato su training o validation valori che specificano come utilizzare i dati durante la creazione di un modello di machine learning.
È necessario fornire almeno un'origine dati ed è consentito un massimo di due origine dati: una per i dati di addestramento e una per i dati di convalida. Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.
Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.
-
Se disponi di una origine dati,
ChannelTypeè impostato sutrainingcome impostazione predefinita e deve avere questo valore.-
Se il valore
ValidationFractioninAutoMLDataSplitConfignon è impostato, per impostazione predefinita viene utilizzato per la convalida lo 0,2 (20%) dei dati di questa origine. -
Se
ValidationFractionè impostato su un valore compreso tra 0 e 1, il set di dati viene suddiviso in base al valore specificato, dove il valore specifica la frazione del set di dati utilizzata per la convalida.
-
-
Se si dispone di due origini dati, per impostazione predefinita il
ChannelTypedi uno degli oggettiAutoMLJobChanneldeve essere impostato sutraining. IlChannelTypedell'altra origine dati deve essere impostato suvalidation. Le due origine dati devono avere lo stesso formato, CSV o Parquet, e lo stesso schema. In questo caso non è necessario impostareValidationFractionperché tutti i dati di ciascuna origine vengono utilizzati per l'addestramento o la convalida. L'impostazione di questo valore causa un errore.
Per abilitare l’implementazione automatica per il miglior modello candidato di un processo AutoML, includi un ModelDeployConfig nella richiesta di processo AutoML. Questo consentirà l’implementazione del modello migliore su un endpoint di SageMaker AI. Di seguito sono riportate le configurazioni disponibili per la personalizzazione.
-
Per consentire ad Autopilot di generare il nome dell'endpoint, imposta
AutoGenerateEndpointNamesuTrue. -
Per fornire il tuo nome per l'endpoint, imposta
AutoGenerateEndpointName to.Falseand provide a name of your choice in EndpointName