Verwenden Sie externe Ressourcen in Amazon SageMaker Studio Lab
Mit Amazon SageMaker Studio Lab können Sie externe Ressourcen wie Jupyter Notebooks und Daten aus Git-Repositorys und Amazon S3 integrieren. Sie können Ihrem GitHub-Repo und Ihren Notebooks auch eine Schaltfläche In Studio Lab öffnen hinzufügen. Mit dieser Schaltfläche können Sie Ihre Notebooks direkt aus Studio Lab klonen.
In den folgenden Themen wird erläutert, wie Sie externe Ressourcen integrieren.
Themen
Verwenden Sie GitHub -Ressourcen
Studio Lab bietet Integration mit GitHub. Mit dieser Integration können Sie Notebooks und Repositorys direkt in Ihr Studio Lab-Projekt klonen.
Die folgenden Themen enthalten Informationen zur Verwendung von GitHub-Ressourcen mit Studio Lab.
Beispiel-Notebooks von Studio Lab
Informationen zu den ersten Schritten mit einer Sammlung von Muster-Notebooks, die auf Studio Lab zugeschnitten sind, finden Sie unter Studio Lab-Beispiel-Notebooks
Dieses Repository bietet Notebooks für die folgenden und andere Anwendungsfälle.
-
Computervision
-
Herstellen einer Verbindung mit AWS
-
Erstellen von benutzerdefinierten Umgebungen
-
Analyse von koordinatenbasierten Daten
-
Natürliche Sprachverarbeitung
-
R verwenden
Klonen eines GitHub-Projektarchivs
Gehen Sie folgendermaßen vor, um ein GitHub-Repo in Ihr Studio Lab-Projekt zu klonen.
-
Starten Sie die Laufzeit Ihres Studio Lab-Projekts. Weitere Informationen zum Starten der Studio Lab-Projektlaufzeit finden Sie unter Starten Sie Ihre Projektlaufzeit.
-
Wählen Sie in Studio Lab im linken Menü das Dateibrowser -Symbol (
), sodass das Dateibrowser-Bedienfeld auf der linken Seite angezeigt wird. -
Navigieren Sie zu Ihrem Benutzerverzeichnis, indem Sie das Dateisymbol unter der Dateisuchleiste auswählen.
-
Wählen Sie im linken Menü das Git-Symbol (
) aus, um ein neues Dropdown-Menü zu öffnen. -
Wählen Sie Repository klonen.
-
Fügen Sie die URL des Repositorys unter Git-Repository-URL (.git) ein.
-
Wählen Sie Clone aus.
Einzelne Notebooks von GitHub klonen
Um ein Notebook in Studio Lab zu öffnen, müssen Sie Zugriff auf das Repository haben, in dem sich das Notebook befindet. In den folgenden Beispielen wird das Verhalten von Studio Lab in Bezug auf Berechtigungen in verschiedenen Situationen beschrieben.
-
Wenn ein Repo öffentlich ist, können Sie das Notebook von der Studio Lab-Vorschauseite aus automatisch in Ihr Projekt klonen.
-
Wenn ein Repo privat ist, werden Sie aufgefordert, sich von der Studio Lab-Vorschauseite aus bei GitHub anzumelden. Wenn Sie Zugriff auf ein privates Repo haben, können Sie das Notebook in Ihr Projekt klonen.
-
Wenn Sie keinen Zugriff auf ein privates Repo haben, können Sie das Notebook nicht von der Studio Lab-Vorschauseite aus klonen.
In den folgenden Abschnitten werden zwei Optionen gezeigt, mit denen Sie ein GitHub-Notebook in Ihr Studio Lab-Projekt kopieren können. Diese Optionen hängen davon ab, ob das Notebook über die Schaltfläche In Studio Lab öffnen verfügt.
Option 1: Kopieren Sie das Notebook mit der Schaltfläche In Studio Lab öffnen
Das folgende Verfahren zeigt, wie Sie ein Notebook kopieren, das über die Schaltfläche In Studio Lab öffnen verfügt. Informationen dazu, wie Sie diese Schaltfläche zu Ihrem Notebook hinzufügen möchten, finden Sie unter Fügen Sie Ihrem Notebook die Schaltfläche In Studio Lab öffnen hinzu.
-
Melden Sie sich bei Studio Lab an, indem Sie den Schritten in Melden Sie sich bei Studio an folgen.
-
Navigieren Sie in einem neuen Browser-Tab zu dem GitHub-Notebook, das Sie klonen möchten.
-
Wählen Sie im Notebook die Schaltfläche In Studio Lab öffnen, um eine neue Seite in Studio Lab mit einer Vorschau des Notebooks zu öffnen.
-
Wenn Ihre Projekt-Runtime noch nicht läuft, starten Sie sie, indem Sie oben auf der Vorschauseite auf die Schaltfläche Laufzeit starten klicken. Warten Sie den Start der Laufzeitumgebung ab, bevor Sie mit dem nächsten Schritt fortfahren.
-
Nachdem Ihre Projektlaufzeit gestartet wurde, wählen Sie In Projekt kopieren, um Ihre Projektlaufzeit in einem neuen Browser-Tab zu öffnen.
-
In der Kopie von GitHub? Wählen Sie im Dialogfeld Nur Notebook kopieren aus. Dadurch wird die Notebook-Datei in Ihr Projekt kopiert.
Option 2: Klonen Sie ein beliebiges GitHub-Notebook
Die folgenden Schritte zeigen, wie Sie ein beliebiges Notebook von GitHub kopieren.
-
Navigiere zu dem Notebook in GitHub.
-
Ändern Sie in der Adressleiste des Browsers die Notebook-URL wie folgt.
# Original URLhttps://github.com/# Modified URL<PATH_TO_NOTEBOOK>https://studiolab.sagemaker.aws/import/github/<PATH_TO_NOTEBOOK> -
Navigieren Sie zur geänderten URL. Dadurch wird eine Vorschau des Notebooks in Studio Lab geöffnet.
-
Wenn Ihre Projekt-Runtime noch nicht läuft, starten Sie sie, indem Sie oben auf der Vorschauseite auf die Schaltfläche Laufzeit starten klicken. Warten Sie den Start der Laufzeitumgebung ab, bevor Sie mit dem nächsten Schritt fortfahren.
-
Nachdem Ihre Projektlaufzeit gestartet wurde, wählen Sie In Projekt kopieren, um Ihre Projektlaufzeit in einem neuen Browser-Tab zu öffnen.
-
In der Kopie von GitHub? Wählen Sie im Dialogfeld Nur Notebook kopieren aus, um die Notebook-Datei in Ihr Projekt zu kopieren.
Fügen Sie Ihrem Notebook die Schaltfläche In Studio Lab öffnen hinzu
Wenn Sie Ihren Notebooks die Schaltfläche In Studio Lab öffnen hinzufügen, können andere Benutzer Ihre Notebooks oder Repositorys direkt in ihre Studio Lab-Projekte klonen. Wenn Sie Ihr Notebook in einem öffentlichen GitHub-Repository teilen, sind Ihre Inhalte öffentlich lesbar. Teilen Sie keine privaten Inhalte wie AWS Zugriffsschlüssel oder AWS Identity and Access Management Anmeldeinformationen in Ihrem Notebook.
Um Ihrem Jupyter Notebook oder -Repository die funktionale Schaltfläche In Studio Lab öffnen hinzuzufügen, fügen Sie oben in Ihrem Notebook oder Repository den folgenden Markdown hinzu.
[](https://studiolab.sagemaker.aws/import/github/<PATH_TO_YOUR_NOTEBOOK_ON_GITHUB>)
Importieren Sie Dateien von Ihrem Computer
Die folgenden Schritte zeigen, wie Sie Dateien von Ihrem Computer in Ihr Studio Lab-Projekt importieren.
-
Öffnen Sie die Studio Lab-Projektlaufzeit.
-
Öffnen Sie das Dateibrowser-Bedienfeld.
-
Wählen Sie in der Aktionsleiste des Dateibrowser-Bedienfelds die Schaltfläche Dateien hochladen.
-
Wählen Sie die Dateien aus, die Sie von Ihrem lokalen Computer hochladen möchten.
-
Wählen Sie Öffnen aus.
Alternativ können Sie Dateien per Drag-and-Drop von Ihrem Computer in das Dateibrowsers-Bedienfeld ziehen.
Mit Amazon S3 verbinden
Das AWS CLI ermöglicht die AWS Integration in Ihr Studio Lab-Projekt. Mit dieser Integration können Sie Ressourcen aus Amazon S3 abrufen, um sie mit Ihren Jupyter Notebooks zu verwenden.
Um AWS CLI mit Studio Lab zu verwenden, führen Sie die folgenden Schritte aus. Ein Notebook, das diese Integration beschreibt, finden Sie unter Studio Lab mit AWS Ressourcen verwenden
-
Installieren Sie das AWS CLI, indem Sie die Schritte in Installieren oder Aktualisieren der neuesten Version des AWS CLI ausführen.
-
Konfigurieren Sie Ihre AWS Anmeldeinformationen, indem Sie den Schritten unter Schnellinstallation folgen. Die Rolle für Ihr AWS Konto muss über Berechtigungen für den Zugriff auf den Amazon-S3-Bucket verfügen, aus dem Sie Daten kopieren.
-
Klonen Sie von Ihrem Jupyter Notebook aus, nach Bedarf Ressourcen aus dem Amazon-S3-Bucket. Der folgende Befehl zeigt, wie Sie alle Ressourcen von einem Amazon S3-Pfad in Ihr Projekt klonen. Weitere Informationen finden Sie in der AWS CLI-Befehlsreferenz
. !aws s3 cp s3://<BUCKET_NAME>/<PATH_TO_RESOURCES>/<PROJECT_DESTINATION_PATH>/ --recursive