Panoramica su Pipelines - Amazon SageMaker AI

Panoramica su Pipelines

Una pipeline di Amazon SageMaker AI è costituita da una serie di fasi interconnesse in un grafo aciclico orientato (DAG), definite utilizzando l’interfaccia utente con trascinamento o l’SDK Pipelines. Puoi anche creare la tua pipeline con lo schema JSON di definizione della pipeline. La definizione JSON di DAG fornisce informazioni sui requisiti e sulle relazioni tra ogni fase della pipeline. La struttura del DAG di una pipeline è determinata dalle dipendenze dei dati tra le varie fasi. Queste dipendenze tra i dati vengono create quando le proprietà dell'output di una fase vengono trasmesse come input a un'altra fase. L'immagine seguente è un esempio di DAG di pipeline:

Esempio di grafo aciclico orientato (DAG) di una pipeline.
Questo DAG di esempio include le fasi seguenti:
  1. AbaloneProcess, un’istanza della fase di elaborazione, esegue uno script di pre-elaborazione sui dati utilizzati per l’addestramento. Ad esempio, lo script può inserire i valori mancanti, normalizzare i dati numerici o suddividere i dati nei set di dati di addestramento, convalida e test.

  2. AbaloneTrain, un’istanza della fase di addestramento, configura gli iperparametri e addestra un modello a partire dai dati di input pre-elaborati.

  3. AbaloneEval, un’altra istanza della fase di elaborazione, valuta l’accuratezza del modello. Questa fase mostra un esempio di dipendenza dai dati: questa fase utilizza l’output del set di dati di test di AbaloneProcess.

  4. AbaloneMSECond è un’istanza di una fase di Condizione che, in questo esempio, verifica che il risultato dell’errore quadratico medio della valutazione del modello sia inferiore a un determinato limite. Se il modello non soddisfa i criteri, l’esecuzione della pipeline si arresta.

  5. L’esecuzione della pipeline procede con le fasi seguenti:

    1. AbaloneRegisterModel, dove SageMaker AI chiama una fase RegisterModel per registrare il modello come gruppo di pacchetti di modelli con controllo delle versioni in Amazon SageMaker Model Registry.

    2. AbaloneCreateModel, dove SageMaker AI chiama una fase CreateModel per creare il modello in preparazione della trasformazione di batch. In AbaloneTransform, SageMaker AI chiama una fase di trasformazione per generare previsioni tramite modello su un set di dati specificato a te.

Gli argomenti seguenti descrivono i concetti fondamentali di Pipelines. Per un tutorial che descrive l'implementazione di questi concetti, consulta Azioni di Pipelines.