Uso di un algoritmo per eseguire un processo di addestramento - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Uso di un algoritmo per eseguire un processo di addestramento

Puoi utilizzare una risorsa di algoritmo per creare un job di addestramento tramite la console di Amazon SageMaker AI, l’API Amazon SageMaker di basso livello oppure Amazon SageMaker Python SDK.

Uso di un algoritmo per eseguire un processo di addestramento (console)

Per usare un algoritmo per eseguire un processo di addestramento (console)
  1. Apri la console di SageMaker AI all’indirizzo https://console.aws.amazon.com/sagemaker/.

  2. Scegli Algoritmi.

  3. Scegli un algoritmo che hai creato dall'elenco nella scheda I miei algoritmi o scegli un algoritmo a cui è stato effettuato l'abbonamento nella scheda Abbonamenti Marketplace AWS.

  4. Scegli Crea processo di addestramento.

    L'algoritmo scelto verrà automaticamente selezionato.

  5. Nella pagina Crea processo di addestramento, inserisci le seguenti informazioni:

    1. Per Nome processo, digita un nome per il processo di addestramento.

    2. Per Ruolo IAM, scegli un ruolo IAM con le autorizzazioni necessarie per eseguire i job di addestramento in SageMaker AI oppure scegli Crea un nuovo ruolo per consentire a SageMaker AI di creare un ruolo con la policy gestita AmazonSageMakerFullAccess collegata. Per informazioni, consultare Come utilizzare i ruoli di esecuzione dell' SageMaker IA.

    3. Per Configurazione delle risorse, specifica le seguenti informazioni:

      1. Per Tipo di istanza, scegli il tipo di istanza da utilizzare per l’addestramento.

      2. Per Conteggio istanze, digita il numero di istanze ML da utilizzare per il processo di addestramento.

      3. Per Volume aggiuntivo per istanza (GB), digita le dimensioni del volume di storage ML da assegnare. I volumi di storage ML memorizzano gli artefatti di modello e gli stati incrementali.

      4. Per Chiave di crittografia, specifica una chiave se desideri che Amazon SageMaker AI utilizzi una chiave AWS Key Management Service per crittografare i dati nel volume di archiviazione ML collegato all’istanza di addestramento.

      5. Per Condizione di arresto, specifica il periodo di tempo massimo in secondi, minuti, ore o giorni che può durare l'esecuzione del processo di addestramento.

    4. Per VPC, scegli un Amazon VPC a cui il container di addestramento può accedere. Per ulteriori informazioni, consulta Offri SageMaker ai corsi di formazione sull'intelligenza artificiale l'accesso alle risorse nel tuo Amazon VPC.

    5. Per Iperparametri, specifica i valori degli iperparametri da utilizzare per il processo di addestramento.

    6. Per Configurazione dei dati di input, specifica i valori riportati di seguito per ogni canale di dati di input da utilizzare per il processo di addestramento. Puoi vedere quali canali sono supportati dall'algoritmo in uso per i processi di addestramento, il tipo di contenuto, il tipo di compressione supportato e le modalità di input supportate per ciascun canale, nella sezione Specifica del canale della pagina Riepilogo dell'algoritmo per l'algoritmo.

      1. Per Nome canale digita il nome del canale di input.

      2. Per Tipo di contenuto digita il tipo di contenuto dei dati previsti dall'algoritmo per il canale.

      3. Per Tipo di compressione, scegli il tipo di compressione dei dati da utilizzare, se presente.

      4. Per Wrapper dei record, scegli RecordIO se l'algoritmo prevede dati nel formato RecordIO.

      5. Per Tipo di dati S3, Tipo di distribuzione dei dati S3 e Percorso S3, specifica i valori appropriati. Per informazioni sul significato dei valori, consulta S3DataSource.

      6. Per Modalità di input, scegli File per scaricare i dati dal volume di storage ML assegnato e montare la directory su un volume Docker. Scegli Pipe per eseguire lo streaming dei dati direttamente da Amazon S3 al container.

      7. Per aggiungere un altro canale di input, scegli Aggiungi canale. Una volta terminata l'aggiunta dei canali di input, scegli Fatto.

    7. Per il percorso di output, specifica i seguenti valori:

      1. Per Percorso di output S3, scegli il percorso S3 in cui il processo di addestramento archivia l'output, ad esempio gli artefatti del modello.

        Nota

        Gli artefatti del modello memorizzati in questa posizione vengono utilizzati per creare un modello o un pacchetto di modelli da questo processo di addestramento.

      2. Per Chiave di crittografia, se desideri che SageMaker AI utilizzi una chiave AWS KMS per crittografare i dati di output a riposo nella posizione S3.

    8. Per Tag, specifica uno o più tag per gestire il processo di addestramento. Ciascun tag è formato da una chiave e da un valore facoltativo. Le chiavi dei tag devono essere univoche per ogni risorsa.

    9. Scegli Crea processo di addestramento per eseguire il processo di addestramento.

Uso di un algoritmo per eseguire un processo di addestramento (API)

Per usare un algoritmo per eseguire un processo di addestramento utilizzando l'API SageMaker, specifica il nome o il nome della risorsa Amazon (ARN) come campo AlgorithmName dell’oggetto AlgorithmSpecification da inoltrare a CreateTrainingJob. Per ulteriori informazioni sui modelli di addestramento in SageMaker AI, consulta Addestramento di un modello con Amazon SageMaker.

Uso di un algoritmo per eseguire un processo di addestramento (Amazon SageMaker Python SDK)

Utilizza un algoritmo che hai creato o a cui ti sei iscritto in Marketplace AWS per creare un processo di addestramento, creare un oggetto AlgorithmEstimator e specificare il nome della risorsa Amazon (ARN) o il nome dell'algoritmo come valore dell'argomento algorithm_arn. Quindi, richiama il metodo fit dello strumento di valutazione. Per esempio:

from sagemaker import AlgorithmEstimator data_path = os.path.join(DATA_DIR, 'marketplace', 'training') algo = AlgorithmEstimator( algorithm_arn='arn:aws:sagemaker:us-east-2:012345678901:algorithm/my-algorithm', role='SageMakerRole', instance_count=1, instance_type='ml.c4.xlarge', sagemaker_session=sagemaker_session, base_job_name='test-marketplace') train_input = algo.sagemaker_session.upload_data( path=data_path, key_prefix='integ-test-data/marketplace/train') algo.fit({'training': train_input})