Panoramica su Pipelines
Una pipeline di Amazon SageMaker AI è costituita da una serie di fasi interconnesse in un grafo aciclico orientato (DAG), definite utilizzando l’interfaccia utente con trascinamento o l’SDK Pipelines
Questo DAG di esempio include le fasi seguenti:
-
AbaloneProcess, un’istanza della fase di elaborazione, esegue uno script di pre-elaborazione sui dati utilizzati per l’addestramento. Ad esempio, lo script può inserire i valori mancanti, normalizzare i dati numerici o suddividere i dati nei set di dati di addestramento, convalida e test. -
AbaloneTrain, un’istanza della fase di addestramento, configura gli iperparametri e addestra un modello a partire dai dati di input pre-elaborati. -
AbaloneEval, un’altra istanza della fase di elaborazione, valuta l’accuratezza del modello. Questa fase mostra un esempio di dipendenza dai dati: questa fase utilizza l’output del set di dati di test diAbaloneProcess. -
AbaloneMSECondè un’istanza di una fase di Condizione che, in questo esempio, verifica che il risultato dell’errore quadratico medio della valutazione del modello sia inferiore a un determinato limite. Se il modello non soddisfa i criteri, l’esecuzione della pipeline si arresta. -
L’esecuzione della pipeline procede con le fasi seguenti:
-
AbaloneRegisterModel, dove SageMaker AI chiama una fase RegisterModel per registrare il modello come gruppo di pacchetti di modelli con controllo delle versioni in Amazon SageMaker Model Registry. -
AbaloneCreateModel, dove SageMaker AI chiama una fase CreateModel per creare il modello in preparazione della trasformazione di batch. InAbaloneTransform, SageMaker AI chiama una fase di trasformazione per generare previsioni tramite modello su un set di dati specificato a te.
-
Gli argomenti seguenti descrivono i concetti fondamentali di Pipelines. Per un tutorial che descrive l'implementazione di questi concetti, consulta Azioni di Pipelines.