Fehlerbehebung bei Amazon SageMaker Studio Classic - Amazon SageMaker AI

Fehlerbehebung bei Amazon SageMaker Studio Classic

Wichtig

Am 30. November 2023 wurde Amazon SageMaker Studio in Amazon SageMaker Studio umbenannt. Der folgende Abschnitt bezieht sich konkret auf die Verwendung der Studio-Classic-Anwendung. Informationen zur Verwendung der aktualisierten Studio-Konfiguration finden Sie unter Amazon SageMaker Studio.

Wichtig

Benutzerdefinierte IAM-Richtlinien, die es Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ermöglichen, Amazon-SageMaker-Ressourcen zu erstellen, müssen auch Berechtigungen zum Hinzufügen von Tags zu diesen Ressourcen gewähren. Die Berechtigung zum Hinzufügen von Tags zu Ressourcen ist erforderlich, da Studio und Studio Classic automatisch alle von ihnen erstellten Ressourcen taggen. Wenn eine IAM-Richtlinie Studio und Studio Classic das Erstellen von Ressourcen, aber kein Tagging erlaubt, können bei dem Versuch, Ressourcen zu erstellen, „AccessDenied“-Fehler auftreten. Weitere Informationen finden Sie unter Bereitstellen von Berechtigungen für das Markieren von SageMaker-AI-Ressourcen.

Verwaltete AWS-Richtlinien für Amazon SageMaker AI, die Berechtigungen zum Erstellen von SageMaker-Ressourcen gewähren, enthalten bereits Berechtigungen zum Hinzufügen von Tags während der Erstellung dieser Ressourcen.

In diesem Thema wird beschrieben, wie Sie allgemeine Probleme mit Amazon SageMaker Studio Classic während der Einrichtung und Verwendung beheben. Im Folgenden sind häufig auftretende Fehler aufgeführt, die bei der Verwendung von Amazon SageMaker Studio Classic auftreten können. Auf jeden Fehler folgt eine Lösung.

Probleme mit der Studio-Classic-Anwendung

Die folgenden Probleme treten beim Starten und Verwenden der Studio-Classic-Anwendung auf.

  • Der Bildschirm wird nicht geladen: Den Workspace löschen und warten hilft nicht

    Beim Starten der Studio-Classic-Anwendung wird in einem Pop-up-Fenster die folgende Meldung angezeigt. Unabhängig davon, welche Option ausgewählt wird, wird Studio Classic nicht geladen.

    Loading... The loading screen is taking a long time. Would you like to clear the workspace or keep waiting?

    Bei der Studio-Classic-Anwendung kann es zu einer Verzögerung beim Start kommen, wenn mehrere Registerkarten im Studio-Classic-Workspace geöffnet sind oder sich mehrere Dateien in Amazon EFS befinden. Dieses Pop-up-Fenster sollte nach einigen Sekunden verschwinden, sobald der Studio-Classic-Workspace bereit ist.

    Wenn Sie nach der Auswahl einer der Optionen weiterhin einen Ladebildschirm mit einem Drehfeld sehen, kann es zu Verbindungsproblemen mit der von Studio Classic verwendeten Amazon Virtual Private Cloud kommen. 

    Überprüfen Sie die folgenden Netzwerkkonfigurationen, um Verbindungsprobleme mit der von Studio Classic verwendeten Amazon Virtual Private Cloud (Amazon VPC) zu beheben:

    • Wenn Ihre Domain im VpcOnly Modus eingerichtet ist: Stellen Sie sicher, dass ein Amazon VPC-Endpunkt für AWS STS oder ein NAT-Gateway für ausgehenden Datenverkehr, einschließlich Verkehr über das Internet, vorhanden ist. Befolgen Sie dafür die unter Verbinden von Studio-Notebooks in einer VPC mit externen Ressourcen beschriebenen Schritte.

    • Wenn Ihre Amazon VPC mit einem benutzerdefinierten DNS anstelle des von Amazon bereitgestellten DNS eingerichtet ist: Stellen Sie sicher, dass die Routen mithilfe des Dynamic Host Configuration Protocol (DHCP) für jeden Amazon-VPC-Endpunkt konfiguriert sind, der der von Studio Classic verwendeten Amazon VPC hinzugefügt wird. Weitere Informationen zur Einstellung standardmäßiger und benutzerdefinierter DHCP-Optionssätze finden Sie unter DHCP-Optionssätze in Amazon VPC.

  • Interner Fehler beim Starten von Studio

    Beim Starten von Studio Classic können Sie die Studio-Classic-Benutzeroberfläche nicht anzeigen. Außerdem wird ein Fehler ähnlich dem folgenden angezeigt, wobei Interner Fehler das Fehlerdetail ist.

    Amazon SageMaker Studio The JupyterServer app default encountered a problem and was stopped.

    Dieser Fehler kann durch mehrere Faktoren verursacht werden. Wenn das Problem durch Abschluss dieser Schritte nicht behoben wird, erstellen Sie ein Problem mit https://aws.amazon.com/premiumsupport/. 

    • Fehlendes Mounting-Ziel von Amazon EFS: Studio Classic verwendet Amazon EFS als Speicher. Das Amazon-EFS-Volume benötigt ein Mounting-Ziel für jedes Subnetz, in dem die Domain von Amazon SageMaker AI erstellt wird. Wenn dieses Mounting-Ziel von Amazon EFS versehentlich gelöscht wird, kann die Studio-Classic-Anwendung nicht geladen werden, da sie das Dateiverzeichnis des Benutzers nicht mounten kann. Führen Sie die folgenden Schritte aus, um dieses Problem zu beheben.

      Um Mount-Ziele zu überprüfen oder zu erstellen.
      1. Suchen Sie mithilfe des DescribeDomain-API-Aufrufs nach dem Amazon EFS-Volume, das der Domain zugeordnet ist. 

      2. Melden Sie sich bei AWS-Managementkonsole an und öffnen Sie die Amazon-SES-Konsole unter https://console.aws.amazon.com/efs/.

      3. Wählen Sie aus der Liste der Amazon EFS-Volumes das Amazon EFS-Volume aus, das der Domain zugeordnet ist.

      4. Wählen Sie auf der Amazon EFS-Detailseite die Registerkarte Netzwerk aus. Stellen Sie sicher, dass Mount-Ziele für alle Subnetze vorhanden sind, in denen die Domain eingerichtet ist.

      5. Wenn Mount-Ziele fehlen, fügen Sie die fehlenden Amazon EFS-Mount-Ziele hinzu. Anweisungen finden Sie unter Mount-Ziele und Sicherheitsgruppen erstellen und verwalten.

      6. Nachdem die fehlenden Mounting-Ziele erstellt wurden, starten Sie die Studio-Classic-Anwendung.

    • Widersprüchliche Dateien im .local-Benutzerordner: Wenn Sie JupyterLab Version 1 auf Studio Classic verwenden, können widersprüchliche Bibliotheken in Ihrem .local-Ordner Probleme beim Starten der Studio-Classic-Anwendung verursachen. Um dieses Problem zu beheben, aktualisieren Sie die Standardversion von JupyterLab Ihres Benutzerprofils auf JupyterLab 3.0. Weitere Informationen zum Anzeigen und Aktualisieren der JupyterLab-Version finden Sie unter JupyterLab-Versionsverwaltung in Amazon SageMaker Studio Classic.

  • ConfigurationError: LifeCycleConfig beim Starten von Studio Classic

    Sie können die Studio-Classic-Benutzeroberfläche beim Starten von Studio Classic nicht anzeigen. Dies wird durch Probleme mit dem standardmäßigen Lifecycle-Konfigurationsskript verursacht, das an die Domain angehängt ist.

    Um Probleme mit der Lebenszykluskonfiguration zu lösen
    1. Sehen Sie sich die Amazon CloudWatch Protokolle für die Lebenszykluskonfiguration an, um den Befehl nachzuverfolgen, der den Fehler verursacht hat. Um das Protokoll einzusehen, folgen Sie den Schritten unter Überprüfen Sie den Lebenszykluskonfigurationsprozess anhand von CloudWatch Logs.

    2. Trennen Sie das Standardskript vom Benutzerprofil oder der Domain. Weitere Informationen finden Sie unter Aktualisieren und Trennen von Lebenszykluskonfigurationen in Amazon SageMaker Studio Classic.

    3. Starten Sie die Studio-Classic-Anwendung.

    4. Debuggen Sie Ihr Lifecycle-Konfigurationsskript. Sie können das Lebenszyklus-Konfigurationsskript vom Systemterminal aus ausführen, um Fehler zu beheben. Wenn das Skript erfolgreich vom Terminal aus ausgeführt wird, können Sie das Skript an das Benutzerprofil oder die Domain anhängen.

  • Die Kernfunktionen von SageMaker Studio Classic sind nicht verfügbar.

    Wenn Sie diese Fehlermeldung beim Öffnen von Studio Classic erhalten, kann dies an Versionskonflikten des Python-Pakets liegen. Dies ist der Fall, wenn Sie die folgenden Befehle in einem Notebook oder Terminal verwendet haben, um Python-Pakete zu installieren, die Versionskonflikte mit SageMaker-AI-Paketabhängigkeiten aufweisen.

    !pip install
    pip install --user

    Führen Sie die folgenden Schritte aus, um dieses Problem zu beheben:

    1. Deinstallieren Sie kürzlich installierte Python-Pakete. Wenn Sie sich nicht sicher sind, welches Paket Sie deinstallieren sollen, erstellen Sie ein Problem mit https://aws.amazon.com/premiumsupport/. 

    2. Starten Sie Studio Classic neu:

      1. Fahren Sie Studio Classic über das Menü Datei herunter.

      2. Warten Sie eine Minute.

      3. Öffnen Sie Studio Classic erneut, indem Sie die Seite aktualisieren oder sie über die AWS-Managementkonsole öffnen.

    Das Problem sollte behoben sein, wenn Sie das Paket deinstalliert haben, das den Konflikt verursacht hat. Um Pakete zu installieren, ohne dieses Problem erneut zu verursachen, verwenden Sie %pip install ohne die --user Flagge.

    Wenn das Problem weiterhin besteht, erstellen Sie ein neues Benutzerprofil und richten Sie Ihre Umgebung mit diesem Benutzerprofil ein.

    Wenn diese Lösungen das Problem nicht beheben, erstellen Sie ein Problem mit https://aws.amazon.com/premiumsupport/. 

  • Studio Classic kann nicht über die AWS-Managementkonsole geöffnet werden.

    Wenn Sie Studio Classic nicht öffnen und keine neue laufende Instance mit allen Standardeinstellungen erstellen können, erstellen Sie ein Problem mit https://aws.amazon.com/premiumsupport/. 

Probleme mit KernelGateway-Anwendungen

Die folgenden Probleme sind spezifisch für KernelGateway-Anwendungen, die in Studio Classic gestartet werden.

  • Auf die Kernel-Sitzung kann nicht zugegriffen werden

    Wenn der Benutzer ein neues Notebook startet, kann er keine Verbindung zur Notebook-Sitzung herstellen. Wenn der Status der KernelGateway-Anwendung In Service lautet, können Sie Folgendes überprüfen, um das Problem zu beheben.

    • Überprüfen Sie die Konfigurationen der Sicherheitsgruppen

      Wenn die Domain im VPCOnly Modus eingerichtet ist, muss die der Domain zugeordnete Sicherheitsgruppe den Verkehr zwischen den Ports im Bereich 8192-65535 für die Konnektivität zwischen den JupyterServer- und KernelGateway-Apps zulassen.

      So überprüfen Sie die Sicherheitsgruppenregeln
      1. Rufen Sie mithilfe des DescribeDomain-API-Aufrufs die der Domain zugehörigen Sicherheitsgruppen ab.

      2. Melden Sie sich an der AWS-Managementkonsole an und öffnen Sie die Amazon-VPC-Konsole unter https://console.aws.amazon.com/vpc/.

      3. Wählen Sie in der Navigationsleiste unter Sicherheit die Option Sicherheitsgruppen aus.

      4. Filtern Sie nach den IDs der Sicherheitsgruppen, die mit der Domain verbunden sind.

      5. Für jede Sicherheitsgruppe:

        1. Wählen Sie die Sicherheitsgruppe aus.

        2. Sehen Sie sich auf der Seite mit den Sicherheitsgruppendetails die Regeln für eingehende Nachrichten an. Stellen Sie sicher, dass Datenverkehr zwischen den Ports im Bereich 8192-65535 zulässig ist.

      Weitere Informationen zu Sicherheitsgruppenregeln finden Sie unter Steuern des Datenverkehrs zu Ressourcen mithilfe von Sicherheitsgruppen. Weitere Informationen zu den Anforderungen für die Verwendung von Studio Classic im VPCOnly-Modus finden Sie unter Verbinden von Studio-Notebooks in einer VPC mit externen Ressourcen.

    • Überprüfen Sie die Firewall- und WebSocket-Verbindungen

      Wenn die KernelGateway-Apps einen InService-Status haben und der Benutzer keine Verbindung zur Notebook-Sitzung von Studio Classic herstellen kann, überprüfen Sie die Firewall- und WebSocket-Einstellungen.

      1. Starten Sie die Studio-Classic-Anwendung. Weitere Informationen finden Sie unter Starten von Amazon SageMaker Studio Classic.

      2. Öffnen Sie die Entwicklertools Ihres Web-Browsers.

      3. Wählen Sie die Registerkarte Network (Netzwerk) aus.

      4. Suchen Sie nach einem Eintrag, der dem folgenden Format entspricht.

        wss://<domain-id>.studio.<region>.sagemaker.aws/jupyter/default/api/kernels/<unique-code>/channels?session_id=<unique-code>

        Wenn der Status- oder Antwortcode für den Eintrag etwas anderes ist als 101, dann verhindern Ihre Netzwerkeinstellungen die Verbindung zwischen der Studio-Classic-Anwendung und den KernelGateway-Apps.

        Um dieses Problem zu beheben, wenden Sie sich an das Team, das Ihre Netzwerkeinstellungen verwaltet, um die Studio-Classic-URL aufzulisten und WebSocket-Verbindungen zu aktivieren. 

  • Eine App konnte aufgrund einer Überschreitung der Ressourcenkontingente nicht gestartet werden

    Wenn ein Benutzer versucht, ein neues Notebook zu starten, schlägt die Erstellung des Notebooks mit einem der folgenden Fehler fehl. Dies wird durch die Überschreitung von Ressourcenkontingenten verursacht.

    • Unable to start more Apps of AppType [KernelGateway] and ResourceSpec(instanceType=[]) for UserProfile []. Please delete an App with a matching AppType and ResourceSpec, then try again

      Studio Classic unterstützt bis zu vier laufende KernelGateway-Apps auf derselben Instance. Um dieses Problem zu lösen, können Sie eine der folgenden Möglichkeiten nutzen:

      • Löschen Sie eine bestehende KernelGateway-Anwendung, die auf der Instance läuft, und starten Sie dann das neue Notebook neu.

      • Starten Sie das neue Notebook auf einem anderen Instance-Typ

      Weitere Informationen finden Sie unter Ändern des Instance-Typs für ein Notebook von Amazon SageMaker Studio Classic.

    • An error occurred (ResourceLimitExceeded) when calling the CreateApp operation

      In diesem Fall verfügt das Konto nicht über ausreichende Limits, um eine Studio-Classic-Anwendung auf dem angegebenen Instance-Typ zu erstellen. Um dieses Problem zu beheben, navigieren Sie zur Service Quotas Konsole unter https://console.aws.amazon.com/servicequotas/. Fordern Sie in dieser Konsole an, das Studio KernelGateway Apps running on instance-type instance Limit zu erhöhen. Weitere Informationen finden Sie unter AWS-Servicekontingente.