Ottimizzazione automatica dei modelli con SageMaker AI - Amazon SageMaker AI

Ottimizzazione automatica dei modelli con SageMaker AI

L’ottimizzazione automatica dei modelli (AMT) di Amazon SageMaker AI individua la versione migliore di un modello eseguendo vari job di addestramento sul tuo set di dati. L’ottimizzazione automatica dei modelli (AMT) di Amazon SageMaker AI è nota anche come ottimizzazione degli iperparametri. A tale scopo, AMT utilizza l'algoritmo e gli intervalli di iperparametri specificati dall'utente. Quindi sceglie i valori iperparametri presenti in un modello che crea la performance migliore, misurata in base a un parametro scelto.

Prendiamo ad esempio l’esecuzione di un problema di classificazione binaria su un set di dati di marketing. Il tuo obiettivo è massimizzare il parametro area sotto la curva (AUC) dell'algoritmo, eseguendo l’addestramento di un modello Algoritmo XGBoost con Amazon SageMaker AI. Vuoi trovare quali dei valori di iperparametri eta, alpha, min_child_weight e max_depth effettueranno l’addestramento migliore per il modello. Specifica un intervallo di valori per questi iperparametri. Quindi, l’ottimizzazione degli iperparametri di SageMaker AI cerca all’interno degli intervalli per trovare una combinazione che generi un job di addestramento in grado di creare un modello con l’AUC più elevata. Per risparmiare risorse o soddisfare una specifica aspettativa di qualità del modello, imposta criteri di completamento in modo da interrompere l’ottimizzazione quando tali criteri sono soddisfatti.

Puoi utilizzare l’AMT di SageMaker AI con gli algoritmi integrati, gli algoritmi personalizzati o i container predefiniti di SageMaker AI per i framework di machine learning.

L’AMT di SageMaker AI può utilizzare un’istanza spot Amazon EC2 per ottimizzare i costi di esecuzione dei job di addestramento. Per ulteriori informazioni, consulta Managed Spot Training in Amazon SageMaker AI.

Prima di iniziare a utilizzare l'ottimizzazione degli iperparametri, il problema di Machine Learning deve essere ben definito, inclusi questi aspetti:

  • Un set di dati

  • Conoscenza del tipo di algoritmo di cui eseguire l’addestramento

  • Una chiara comprensione di come quantificare il successo

Prepara il tuo set di dati e il tuo algoritmo in modo che funzionino in SageMaker AI ed esegui con successo almeno una volta un job di addestramento. Per ulteriori informazioni sulla configurazione e l'esecuzione di un processo di addestramento, consulta Guida alla configurazione con Amazon SageMaker AI.