Parametri obbligatori Parametri facoltativi

Creare un processo di classificazione delle immagini utilizzando l’API AutoML

Le seguenti istruzioni mostrano come creare un job Amazon SageMaker Autopilot come esperimento pilota per tipi di problemi di classificazione delle immagini utilizzando SageMaker API Reference.

Nota

Attività come la classificazione di testo e immagini, la previsione di serie temporali e il fine-tuning di modelli linguistici di grandi dimensioni sono disponibili esclusivamente tramite la versione 2 della REST API AutoML. Se il linguaggio che preferisci è Python, puoi fare riferimento AWS SDK per Python (Boto3)o direttamente all'oggetto AutoMLV2 di Amazon SageMaker Python SDK.

Gli utenti che preferiscono la comodità di un'interfaccia utente possono utilizzare Amazon SageMaker Canvas per accedere a modelli pre-addestrati e modelli di base di intelligenza artificiale generativa o creare modelli personalizzati su misura per testi specifici, classificazione delle immagini, esigenze di previsione o intelligenza artificiale generativa.

Puoi creare un esperimento di classificazione delle immagini Autopilot a livello di codice richiamando l'azione dell'CreateAutoMLJobV2API in qualsiasi lingua supportata da Amazon Autopilot o da. SageMaker AWS CLI

Per informazioni su come questa azione API si traduce in una funzione nella lingua che preferisci, consulta Vedi anche di CreateAutoMLJobV2 e seleziona un SDK. Ad esempio, per gli utenti di Python, vedi la sintassi completa della richiesta di create_auto_ml_job_v2 in AWS SDK per Python (Boto3).

Di seguito è riportata una raccolta di parametri di richiesta di input obbligatori e facoltativi per l'azione API CreateAutoMLJobV2 utilizzata nella classificazione delle immagini.

Parametri obbligatori

Quando chiami CreateAutoMLJobV2 per creare un esperimento Autopilot per la classificazione delle immagini, devi fornire i seguenti valori:

Un AutoMLJobName per specificare il nome del processo.
Almeno un AutoMLJobChannel in AutoMLJobInputDataConfig per specificare l'origine dati.
Un AutoMLProblemTypeConfig di tipo ImageClassificationJobConfig.
Un OutputDataConfig per specificare il percorso di output di Amazon S3 per archiviare gli artefatti del processo AutoML.
Un RoleArn per specificare l'ARN del ruolo utilizzato per accedere ai dati.

Tutti gli altri parametri sono facoltativi.

Parametri facoltativi

Le sezioni seguenti forniscono dettagli su alcuni parametri opzionali che è possibile passare al processo AutoML di classificazione delle immagini.

È possibile fornire il proprio set di dati di convalida e un rapporto di suddivisione dei dati personalizzato oppure lasciare che Autopilot suddivida automaticamente il set di dati.

Ogni AutoMLJobChanneloggetto (vedi il parametro richiesto AutoMLJobInputDataConfig) ha unChannelType, che può essere impostato su uno training o più validation valori che specificano come utilizzare i dati durante la creazione di un modello di apprendimento automatico.

È necessario fornire almeno un'origine dati ed è consentito un massimo di due origine dati: una per i dati di addestramento e una per i dati di convalida. Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.

Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.

Se disponi di una origine dati, ChannelType è impostato su training come impostazione predefinita e deve avere questo valore.
- Se il valore ValidationFraction in AutoMLDataSplitConfig non è impostato, per impostazione predefinita viene utilizzato per la convalida lo 0,2 (20%) dei dati di questa origine.
- Se ValidationFraction è impostato su un valore compreso tra 0 e 1, il set di dati viene suddiviso in base al valore specificato, dove il valore specifica la frazione del set di dati utilizzata per la convalida.
Se si dispone di due origini dati, per impostazione predefinita il ChannelType di uno degli oggetti AutoMLJobChannel deve essere impostato su training. Il ChannelType dell'altra origine dati deve essere impostato su validation. Le due origine dati devono avere lo stesso formato, CSV o Parquet, e lo stesso schema. In questo caso non è necessario impostare ValidationFraction perché tutti i dati di ciascuna origine vengono utilizzati per l'addestramento o la convalida. L'impostazione di questo valore causa un errore.

Per abilitare l’implementazione automatica per il miglior modello candidato di un processo AutoML, includi un ModelDeployConfig nella richiesta di processo AutoML. Ciò consentirà l'implementazione del modello migliore su un endpoint di SageMaker intelligenza artificiale. Di seguito sono riportate le configurazioni disponibili per la personalizzazione.

Per consentire ad Autopilot di generare il nome dell'endpoint, imposta AutoGenerateEndpointName su True.
Per fornire il tuo nome per l'endpoint, imposta AutoGenerateEndpointName to False and provide a name of your choice in EndpointName.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Configura l'output di inferenza

Formato dei set di dati e parametro obiettivo