Creare un processo di classificazione delle immagini utilizzando l’API AutoML - Amazon SageMaker AI

Creare un processo di classificazione delle immagini utilizzando l’API AutoML

Le seguenti istruzioni mostrano come creare un processo pilota automatico Amazon SageMaker come esperimento pilota per tipi di problemi di classificazione delle immagini testo utilizzando SageMaker API Reference.

Nota

Attività come la classificazione di testo e immagini, la previsione di serie temporali e il fine-tuning di modelli linguistici di grandi dimensioni sono disponibili esclusivamente tramite la versione 2 della REST API AutoML. Se il linguaggio preferito è Python, è possibile fare riferimento ad AWS SDK per Python (Boto3) o direttamente all’oggetto AutoMLV2 di Amazon SageMaker Python SDK.

Gli utenti che preferiscono la comodità di un’interfaccia utente possono utilizzare Amazon SageMaker Canvas per accedere a modelli preaddestrati e modelli di fondazione di IA generativa o creare modelli personalizzati su misura per esigenze specifiche di testo, classificazione delle immagini, previsioni o IA generativa.

Puoi creare un esperimento Autopilot per la classificazione delle immagini a livello di programmazione richiamando l'azione dell'API CreateAutoMLJobV2 in qualsiasi linguaggio supportato dal pilota automatico Amazon SageMaker o da AWS CLI.

Per informazioni su come questa azione API si traduce in una funzione nella lingua che preferisci, consulta Vedi anche di CreateAutoMLJobV2 e seleziona un SDK. Ad esempio, per gli utenti di Python, vedi la sintassi completa della richiesta di create_auto_ml_job_v2 in AWS SDK per Python (Boto3).

Di seguito è riportata una raccolta di parametri di richiesta di input obbligatori e facoltativi per l'azione API CreateAutoMLJobV2 utilizzata nella classificazione delle immagini.

Parametri obbligatori

Quando chiami CreateAutoMLJobV2 per creare un esperimento Autopilot per la classificazione delle immagini, devi fornire i seguenti valori:

Tutti gli altri parametri sono facoltativi.

Parametri facoltativi

Le sezioni seguenti forniscono dettagli su alcuni parametri opzionali che è possibile passare al processo AutoML di classificazione delle immagini.

È possibile fornire il proprio set di dati di convalida e un rapporto di suddivisione dei dati personalizzato oppure lasciare che Autopilot suddivida automaticamente il set di dati.

Ogni oggetto AutoMLJobChannel (vedi il parametro richiesto AutoMLJobInputDataConfig) ha un ChannelType, che può essere impostato su training o validation valori che specificano come utilizzare i dati durante la creazione di un modello di machine learning.

È necessario fornire almeno un'origine dati ed è consentito un massimo di due origine dati: una per i dati di addestramento e una per i dati di convalida. Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.

Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.

  • Se disponi di una origine dati, ChannelType è impostato su training come impostazione predefinita e deve avere questo valore.

    • Se il valore ValidationFraction in AutoMLDataSplitConfig non è impostato, per impostazione predefinita viene utilizzato per la convalida lo 0,2 (20%) dei dati di questa origine.

    • Se ValidationFraction è impostato su un valore compreso tra 0 e 1, il set di dati viene suddiviso in base al valore specificato, dove il valore specifica la frazione del set di dati utilizzata per la convalida.

  • Se si dispone di due origini dati, per impostazione predefinita il ChannelType di uno degli oggetti AutoMLJobChannel deve essere impostato su training. Il ChannelType dell'altra origine dati deve essere impostato su validation. Le due origine dati devono avere lo stesso formato, CSV o Parquet, e lo stesso schema. In questo caso non è necessario impostare ValidationFraction perché tutti i dati di ciascuna origine vengono utilizzati per l'addestramento o la convalida. L'impostazione di questo valore causa un errore.

Per abilitare l’implementazione automatica per il miglior modello candidato di un processo AutoML, includi un ModelDeployConfig nella richiesta di processo AutoML. Questo consentirà l’implementazione del modello migliore su un endpoint di SageMaker AI. Di seguito sono riportate le configurazioni disponibili per la personalizzazione.