Von Studio aus eine Connect zu einer Serverless-Anwendung herstellen - Amazon SageMaker AI

Von Studio aus eine Connect zu einer Serverless-Anwendung herstellen

Datenwissenschaftler und Dateningenieure können direkt über die Studio-Benutzeroberfläche eine serverlose EMR-Anwendung auffinden und eine Verbindung zu ihr herstellen. Stellen Sie zunächst sicher, dass Sie eine serverlose EMR-Anwendung erstellt haben, indem Sie den Anweisungen unter folgen. Erstellen Sie Serverless-Anwendungen aus Studio

Sie können eine EMR-Serverless-Anwendung direkt über die Studio-Benutzeroberfläche mit einem neuen JupyterLab-Notebook verbinden oder die Verbindung in einem Notebook einer laufenden JupyterLab-Anwendung initiieren.

Wichtig

Wenn Sie Studio verwenden, können Sie nur EMR-Serverless-Anwendungen für JupyterLab-Anwendungen erkennen und eine Verbindung zu diesen herstellen, die von privaten Bereichen aus gestartet werden. Stellen Sie sicher, dass sich die EMR Serverless-Anwendungen in derselben AWS Region wie Ihre Studio-Umgebung befinden. Ihr JupyterLab-Bereich muss eine Image-Version der SageMaker Distribution oder höher verwenden. 1.10

So verbinden Sie eine EMR Serverless-Anwendung über die Studio-Benutzeroberfläche mit einem neuen JupyterLab-Notebook:
  1. Navigieren Sie in der Studio-Benutzeroberfläche zum linken Bereich und wählen Sie im linken Navigationsmenü den Knoten Data aus. Scrollen Sie dann und wählen Sie die Option Amazon EMR-Anwendungen und -Cluster aus. Dadurch wird eine Seite geöffnet, auf der die Amazon EMR-Anwendungen, auf die Sie in der Studio-Umgebung zugreifen können, auf der Registerkarte Serverlose Anwendungen angezeigt werden.

    Anmerkung

    Wenn Sie oder Ihr Administrator die Berechtigungen so konfiguriert haben, dass sie den kontoübergreifenden Zugriff auf EMR Serverless-Anwendungen ermöglichen, können Sie eine konsolidierte Liste der Anwendungen für alle Konten anzeigen, denen Sie Zugriff auf Studio gewährt haben.

  2. Wählen Sie eine EMR Serverless-Anwendung aus, die Sie mit einem neuen Notebook verbinden möchten, und wählen Sie dann An Notebook anfügen. Dadurch wird ein modales Fenster geöffnet, in dem die Liste Ihrer JupyterLab-Bereiche angezeigt wird.

    • Wählen Sie den privaten Bereich aus, von dem aus Sie eine JupyterLab-Anwendung starten möchten, und wählen Sie dann Notebook öffnen. Dadurch wird eine JupyterLab-Anwendung von Ihrem ausgewählten Bereich aus gestartet und ein neues Notebook geöffnet.

    • Alternativ können Sie einen neuen privaten Bereich erstellen, indem Sie oben im modalen Fenster auf die Schaltfläche Neuen Bereich erstellen klicken. Geben Sie einen Namen für Ihren Bereich ein und wählen Sie dann Bereich erstellen und Notebook öffnen. Dadurch wird ein privater Bereich mit dem Standard-Instance-Typ und dem neuesten verfügbaren SageMaker-Distributions-Image erstellt, eine JupyterLab-Anwendung gestartet und ein neues Notebook geöffnet.

  3. Wählen Sie den Namen der IAM-Runtime-Ausführungsrolle, die Ihre EMR Serverless-Anwendung für die Jobausführung übernehmen kann. Nach der Auswahl füllt ein Verbindungsbefehl die erste Zelle Ihres Notebooks und initiiert die Verbindung mit der EMR-Serverless-Anwendung.

    Wichtig

    Um ein JupyterLab-Notebook erfolgreich mit einer serverlosen EMR-Anwendung zu verbinden, müssen Sie zunächst die Liste der Runtime-Rollen mit Ihrer Domain oder Ihrem Benutzerprofil verknüpfen, wie unter beschrieben. Richten Sie die Berechtigungen ein, um das Auflisten und Starten von Amazon EMR-Anwendungen von SageMaker Studio aus zu ermöglichen Wenn Sie diesen Schritt nicht abschließen, können Sie die Verbindung nicht herstellen.

    Sobald die Verbindung erfolgreich hergestellt wurde, bestätigt eine Meldung die Verbindung, startet Ihre EMR Serverless-Anwendung und initiiert Ihre Spark-Sitzung.

    Anmerkung

    Wenn Sie eine Verbindung zu einer EMR Serverless-Anwendung herstellen, wechselt ihr Status von entweder Stopped oder Created zu. Started

Alternativ können Sie von einem JupyterLab-Notebook aus eine Verbindung zu einem Cluster herstellen.
  1. Wählen Sie oben rechts in Ihrem Notebook die Option Cluster aus. Dadurch wird ein modales Fenster geöffnet, in dem die EMR Serverless-Anwendungen aufgeführt sind, auf die Sie zugreifen können. Sie können die Anwendungen auf der Registerkarte Serverlose Anwendungen sehen.

  2. Wählen Sie die Anwendung aus, zu der Sie eine Verbindung herstellen möchten, und wählen Sie dann Verbinden aus.

  3. EMR Serverless unterstützt Runtime-IAM-Rollen, die bei der Festlegung der erforderlichen Berechtigungen vorinstalliert wurden, wie unter beschrieben. Richten Sie die Berechtigungen ein, um das Auflisten und Starten von Amazon EMR-Anwendungen von SageMaker Studio aus zu ermöglichen Wenn Sie diesen Schritt nicht abschließen, können Sie die Verbindung nicht herstellen.

    Sie können Ihre Rolle aus dem Dropdown-Menü für die Amazon EMR-Ausführungsrolle auswählen. Wenn Sie eine Verbindung zu EMR Serverless herstellen, fügt Studio einen Codeblock zu einer aktiven Zelle Ihres Notebooks hinzu, um die Verbindung herzustellen.

  4. Eine aktive Zelle wird ausgefüllt und ausgeführt. Diese Zelle enthält den Befehl Connection Magic, um Ihr Notebook mit Ihrer Anwendung zu verbinden.

    Sobald die Verbindung hergestellt wurde, bestätigt eine Meldung die Verbindung und den Start der Spark-Anwendung. Sie können damit beginnen, Ihre Datenverarbeitungsaufträge an Ihre EMR Serverless-Anwendung zu senden.