Verfolgen der Herkunft einer Pipeline - Amazon SageMaker AI

Verfolgen der Herkunft einer Pipeline

In diesem Tutorial verwenden Sie Amazon SageMaker Studio, um die Herkunft einer ML-Pipeline von Amazon SageMaker AI zu verfolgen.

Die Pipeline wurde mit dem Notebook Orchestrierung von Aufträgen mit Amazon SageMaker Model Building Pipelines im GitHub-Beispiel-Repository von Amazon SageMaker erstellt. Ausführliche Informationen zur Erstellung der Pipeline finden Sie unter Definieren einer Pipeline.

Lineage-Tracking in Studio basiert auf einem azyklisch gerichteten Diagramm (DAG). Die DAG stellt die Schritte in einer Pipeline dar. Von der DAG aus können Sie die Herkunft von jedem Schritt zu jedem anderen Schritt verfolgen. Das folgende Diagramm zeigt die einzelnen Schritte in der Pipeline. Diese Schritte werden in Studio als DAG angezeigt.

Ein Diagramm der Schritte eines Pipeline-Workflows.

Um die Herkunft einer Pipeline in der Amazon SageMaker Studio-Konsole nachzuverfolgen, führen Sie die folgenden Schritte aus, je nachdem, ob Sie Studio oder Studio Classic verwenden.

Studio
Um die Herkunft einer Pipeline zu verfolgen
  1. Öffnen Sie die SageMaker-Studio-Konsole, indem Sie die Anweisungen unter Starten von Amazon SageMaker Studio befolgen.

  2. Wählen Sie im linken Navigationsbereich die Option Pipelines aus.

  3. (Optional) Um die Liste der Pipelines nach Namen zu filtern, geben Sie einen vollständigen Namen oder einen Teil in das Suchfeld ein.

  4. Wählen Sie in der Spalte Name einen Pipeline-Namen aus, um Details zur Pipeline anzuzeigen.

  5. Wählen Sie die Registerkarte Ausführungen.

  6. Wählen Sie in der Spalte Name der Tabelle Ausführungen den Namen einer Pipeline-Ausführung aus, die Sie anzeigen möchten.

  7. Wählen Sie oben rechts auf der Seite Ausführungen die vertikalen Auslassungspunkte und dann Pipeline-Definition herunterladen (JSON) aus. Sie können sich die Datei ansehen, um zu sehen, wie das Pipeline-Diagramm definiert wurde.

  8. Wählen Sie Bearbeiten, um den Pipeline Designer zu öffnen.

  9. Verwenden Sie die Steuerelemente zur Größenänderung und zum Zoomen in der oberen rechten Ecke der Leinwand, um das Diagramm zu vergrößern und zu verkleinern, das Diagramm an den Bildschirm anzupassen oder das Diagramm auf den Vollbildmodus zu erweitern.

  10. Führen Sie die folgenden Schritte aus, um Ihre Trainings-, Validierungs- und Testdatensätze anzuzeigen:

    1. Wählen Sie in Ihrem Pipeline-Diagramm den Verarbeitungsschritt aus.

    2. Wählen Sie in der rechten Seitenleiste den Tab „Übersicht“.

    3. Suchen Sie im Abschnitt Dateien die Amazon-S3-Pfade zu den Trainings-, Validierungs- und Testdatensätzen.

  11. Um Ihre Modellartefakte anzuzeigen, führen Sie die folgenden Schritte aus:

    1. Wählen Sie in Ihrem Pipeline-Diagramm den Trainingsschritt aus.

    2. Wählen Sie in der rechten Seitenleiste den Tab „Übersicht“.

    3. Suchen Sie im Abschnitt Dateien nach den Amazon S3 S3-Pfaden zum Modellartefakt.

  12. Führen Sie die folgenden Schritte aus, um das Modellpaket ARN zu finden:

    1. Wählen Sie den Schritt Modell registrieren aus.

    2. Wählen Sie in der rechten Seitenleiste den Tab „Übersicht“.

    3. Suchen Sie im Abschnitt Dateien nach dem ARN des Modellpakets.

Studio Classic
Um die Herkunft einer Pipeline zu verfolgen
  1. Melden Sie sich bei Amazon SageMaker Studio Classic an. Weitere Informationen finden Sie unter Starten von Amazon SageMaker Studio Classic.

  2. Wählen Sie in der linken Seitenleiste von Studio das Symbol Startseite ( Black square icon representing a placeholder or empty image. ).

  3. Wählen Sie im Menü Pipelines aus.

  4. Verwenden Sie das Suchfeld, um die Liste der Pipelines zu filtern.

  5. Wählen Sie die AbalonePipeline-Pipeline aus, um die Ausführungsliste und andere Details zur Pipeline anzuzeigen.

  6. Wählen Sie das Symbol Eigenschafteninspektor ( Black square icon representing a placeholder or empty image. ) in der rechten Seitenleiste, um den Bereich TABELLENEIGENSCHAFTEN zu öffnen, in dem Sie auswählen können, welche Eigenschaften angezeigt werden sollen.

  7. Wählen Sie die Registerkarte Einstellungen und dann Pipeline-Definitionsdatei herunterladen. Sie können sich die Datei ansehen, um zu sehen, wie das Pipeline-Diagramm definiert wurde.

  8. Wählen Sie auf der Registerkarte Ausführung die erste Zeile in der Ausführungsliste aus, um das zugehörige Ausführungsdiagramm und weitere Details zur Ausführung anzuzeigen. Beachten Sie, dass das Diagramm mit dem Diagramm übereinstimmt, das zu Beginn des Tutorials angezeigt wurde.

    Verwenden Sie die Größenänderungssymbole unten rechts im Diagramm, um das Diagramm zu vergrößern oder zu verkleinern, das Diagramm an den Bildschirm anzupassen oder das Diagramm auf Vollbild anzuzeigen. Um sich auf einen bestimmten Teil des Diagramms zu konzentrieren, können Sie einen leeren Bereich des Diagramms auswählen und das Diagramm so ziehen, dass es in der Mitte dieses Bereichs liegt. Der Einschub unten rechts im Diagramm zeigt Ihre Position im Diagramm an.

    Ein Beispiel für ein Pipeline-Diagramm mit eingefügten Symbolen und Symbolen zur Größenänderung.
  9. Wählen Sie auf der Registerkarte Diagramm den AbaloneProcess Schritt aus, um Details zu dem Schritt anzuzeigen.

  10. Die Amazon S3-Pfade zu den Trainings-, Validierungs- und Testdatensätzen finden Sie auf der Registerkarte Ausgabe unter Dateien.

    Anmerkung

    Um die vollständigen Pfade zu erhalten, klicken Sie mit der rechten Maustaste auf den Pfad und wählen Sie dann Zelleninhalt kopieren.

    s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/train s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/validation s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/test
  11. Wählen Sie den Schritt AbaloneTrain.

  12. Suchen Sie den Amazon S3-Pfad zum Modellartefakt auf der Registerkarte Ausgabe unter Dateien:

    s3://sagemaker-eu-west-1-acct-id/AbaloneTrain/pipelines-6locnsqz4bfu-AbaloneTrain-NtfEpI0Ahu/output/model.tar.gz
  13. Wählen Sie den Schritt AbaloneRegisterModel.

  14. Suchen Sie den ARN des Modellpakets auf der Registerkarte Ausgabe unter Dateien:

    arn:aws:sagemaker:eu-west-1:acct-id:model-package/abalonemodelpackagegroupname/2