Debuggen von Lebenszykluskonfigurationen in Amazon SageMaker Studio Classic - Amazon SageMaker AI

Debuggen von Lebenszykluskonfigurationen in Amazon SageMaker Studio Classic

Wichtig

Am 30. November 2023 wurde Amazon SageMaker Studio in Amazon SageMaker Studio umbenannt. Der folgende Abschnitt bezieht sich konkret auf die Verwendung der Studio-Classic-Anwendung. Informationen zur Verwendung der aktualisierten Studio-Konfiguration finden Sie unter Amazon SageMaker Studio.

In den folgenden Themen erfahren Sie, wie Sie Informationen über Ihre Lebenszykluskonfigurationen abrufen und debuggen.

Überprüfen Sie den Lebenszykluskonfigurationsprozess anhand von CloudWatch Logs

Lebenszykluskonfigurationen protokollieren nur STDOUT und STDERR.

STDOUT ist die Standardausgabe für Bash-Skripte. Sie können in STDERR schreiben, indem Sie >&2 an das Ende eines Bash-Befehls anhängen. Zum Beispiel echo 'hello'>&2.

Die Protokolle für Ihre Lebenszykluskonfigurationen werden mithilfe von Amazon CloudWatch in Ihrer AWS-Konto veröffentlicht. Diese Protokolle finden Sie im /aws/sagemaker/studio Protokollstream in der CloudWatch-Konsole.

  1. Öffnen Sie die CloudWatch-Konsole unter https://console.aws.amazon.com/cloudwatch/.

  2. Wählen Sie auf der linken Seite Protokolle aus. Wählen Sie im Dropdown-Menü Protokollgruppen aus.

  3. Suchen Sie auf der Seite Protokollgruppen nach aws/sagemaker/studio.

  4. Wählen Sie die -Protokollgruppe aus.

  5. Wählen Sie auf der Seite mit den Details zur Protokollgruppe die Registerkarte Protokollstreams aus.

  6. Um die Logs für eine bestimmte App zu finden, durchsuchen Sie die Log-Streams im folgenden Format:

    domain-id/space-name/app-type/default/LifecycleConfigOnStart

    Um beispielsweise die Protokolle der Lebenszykluskonfiguration für Domain d-m85lcu8vbqmz, Bereichsname i-sonic-js und Anwendungstyp JupyterLab zu finden, verwenden Sie die folgende Suchzeichenfolge:

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/default/LifecycleConfigOnStart

Fehler in der JupyterServer-App

Wenn Ihre JupyterServer-App aufgrund eines Problems mit der angehängten Lebenszykluskonfiguration abstürzt, zeigt Studio Classic die folgende Fehlermeldung auf dem Studio-Classic-Startbildschirm an.

Failed to create SageMaker Studio due to start-up script failure

Wählen Sie den View script logs Link aus, um die CloudWatch-Protokolle für Ihre JupyterServer-App anzuzeigen.

Wenn die fehlerhafte Lebenszykluskonfiguration in der DefaultResourceSpec Ihrer Domain, Ihres Benutzerprofils oder Ihres gemeinsam genutzten Bereichs angegeben ist, verwendet Studio die Lebenszykluskonfiguration auch nach einem Neustart von Studio weiter.

Um diesen Fehler zu beheben, folgen Sie den Schritten in Festlegen einer Standard-Lebenszykluskonfiguration für Amazon SageMaker Studio Classic, um das Skript für die Lebenszykluskonfiguration aus dem DefaultResourceSpec zu entfernen oder ein anderes Skript als Standard zu wählen. Starten Sie dann eine neue JupyterServer-App.

Fehler in der KernelGateway-App

Wenn Ihre KernelGateway-App aufgrund eines Problems mit der angehängten Lebenszykluskonfiguration abstürzt, zeigt Studio Classic die Fehlermeldung in Ihrem Studio-Classic-Notebook an.

Wählen Sie View script logs, ob Sie die CloudWatch-Protokolle für Ihre KernelGateway-App anzeigen möchten.

In diesem Fall wird Ihre Lebenszykluskonfiguration im Studio Classic Launcher angegeben, wenn Sie ein neues Studio-Classic-Notebook starten.

Um diesen Fehler zu beheben, verwenden Sie den Studio Classic Launcher, um eine andere Lebenszykluskonfiguration auszuwählen, oder wählen Sie No script aus.

Anmerkung

Eine in DefaultResourceSpec angegebene Standard-KernelGateway-Lebenszykluskonfiguration gilt für alle KernelGateway-Images in der Domain, im Benutzerprofil oder im gemeinsam genutzten Bereich, es sei denn, der Benutzer wählt ein anderes Skript aus der im Studio Classic Launcher angezeigten Liste aus. Das Standardskript No Script wird auch ausgeführt, wenn es vom Benutzer ausgewählt wird. Weitere Informationen zur Auswahl einer Schrift finden Sie unter Schritt 3: Starten einer Anwendung mit der Lebenszykluskonfiguration.

Timeout für die Lebenszykluskonfiguration

Für die Lebenszykluskonfiguration gilt ein Timeout von 5 Minuten. Wenn die Ausführung eines Skripts für die Lebenszykluskonfiguration länger als 5 Minuten dauert, gibt Studio Classic einen Fehler aus.

Um diesen Fehler zu beheben, stellen Sie sicher, dass Ihr Lebenszykluskonfigurationsskript in weniger als 5 Minuten abgeschlossen ist.

Gehen Sie zum Reduzieren der Laufzeit von Skripten wie folgt vor:

  • Beschränken Sie sich auf notwendige Schritte. Schränken Sie zum Beispiel ein, in welchen conda-Umgebungen große Pakete installiert werden sollen.

  • Führen Sie Aufgaben in parallelen Prozessen aus.

  • Verwenden Sie den nohup Befehl in Ihrem Skript, um sicherzustellen, dass Hangup-Signale ignoriert werden, und um die Ausführung des Skripts nicht zu beenden.