Mit Ressourcen arbeiten (Benutzerhandbuch)
Verwenden Sie SageMaker Assets, um nahtlos mit anderen Personen in Ihrem Unternehmen an Machine-Learning-Projekten zusammenzuarbeiten. Mit SageMaker Assets können Sie und Ihre Mitarbeiter Modelle und Datentabellen erstellen und miteinander teilen. In SageMaker Assets werden diese Modelle und Datentabellen als Assets bezeichnet.
SageMaker Assets ist eine Funktion in Amazon SageMaker Studio. Sie oder Ihr Administrator erstellen eine Studio-Umgebung innerhalb eines Amazon DataZone-Projekts. Weitere Informationen zum Einrichten von Amazon DataZone finden Sie unter SageMaker Assets einrichten (Administratorhandbuch).
Bei Assets handelt es sich um ML-Assets oder Daten-Assets. ML-Assets sind Metadaten, die auf Folgendes verweisen:
-
Feature Store Featuregruppen
-
SageMaker AI
Die zugrunde liegenden Modellgruppen und Feature-Gruppen sind die Datenquellen. Wenn Sie eine Feature- oder Modellgruppe aktualisieren, wird das Asset für die Modell- oder Featuregruppe innerhalb eines Tages aktualisiert.
Datenbestände sind Metadaten, die auf Folgendes verweisen:
-
Amazon-Redshift-Tabellen
-
AWS Glue-Tabellen
Bei Datenbeständen ist die Datenquelle der Mechanismus, der Metadaten aus den AWS Glue Tabellen und Amazon Redshift Redshift-Tabellen in das Asset abruft. Beispielsweise zieht eine Datenquelle die Metadaten aus einer AWS Glue Tabelle in das Asset für diese Tabelle.
Sie können ein Asset für alle in Ihrer Organisation sichtbar machen, indem Sie es veröffentlichen. Einzelpersonen können die Metadaten im Asset überprüfen und Zugriff beantragen. Wenn Sie Zugriff gewähren, erhalten sie Zugriff auf die zugrunde liegende maschinelle Lernquelle oder Tabelle.
Ihr Administrator hat Ihnen wahrscheinlich Zugriff auf die Funktionsgruppen, Modellgruppen und Tabellen gewährt. Wenn nicht, lesen Sie die Informationen in, SageMaker Assets einrichten (Administratorhandbuch) um Ihnen den Einstieg zu erleichtern.
Die folgenden Abschnitte enthalten Referenzinformationen für Objekt- und Modellgruppen.
Der Amazon SageMaker Feature Store bietet einen zentralen Ort, an dem Sie Ihre Funktionen speichern und verwalten können. Es ist ein hochleistungsfähiges Repository, das Sie für die Feature-Entwicklung verwenden können.
Im Feature Store werden Features in einer Feature-Gruppe gespeichert. Eine Feature-Gruppe ist eine Sammlung von Funktionen, die sich auf ein Projekt beziehen, an dem Sie arbeiten. Wenn Sie beispielsweise an einem Projekt arbeiten, das sich auf die Vorhersage von Immobilienpreisen bezieht, kann eine Feature-Gruppe Funktionen wie die Lage oder die Anzahl der Schlafzimmer enthalten.
Weitere Informationen dazu, wie Sie Feature-Gruppen verwenden können, um das Feature-Engineering zu optimieren, finden Sie unter Erstellen, Speichern und Teilen von Features mit Feature Store.
Sie können SageMaker AI-Modellgruppen in SageMaker Model Registry verwenden, um verschiedene Versionen Ihrer Modelle zu organisieren und zu verwalten. Sie können die verschiedenen Versionen der Modelle vergleichen, um herauszufinden, welche für Ihren Anwendungsfall am besten geeignet ist. Weitere Informationen zur SageMaker Model Registry finden Sie unter Bereitstellung von Modellregistrierung mit Model Registry.
Im Folgenden finden Sie Hintergrundinformationen zu Amazon Redshift undAWS Glue.
Amazon Redshift ist ein groß angelegter Data Warehousing-Service, der eine schnelle Abfrageleistung für große Datensätze bietet. Weitere Informationen zu Amazon Redshift finden Sie unter Amazon Redshift Serverless.
AWS Glueist ein Extrahieren, Transformieren, Laden (ETL) -Dienst, mit dem Sie den Prozess der Datenvorbereitung vereinfachen können. Weitere Informationen zu AWS Glue finden Sie unter Was ist AWS Glue?
Sie können den SQL-Editor verwenden, um eine Verbindung AWS Glue zu Amazon Redshift Redshift-Datenbanken herzustellen und Abfragen auszuführen. Sie können alle Tabellen, die Sie im Editor erstellen, in SageMaker Assets teilen. Weitere Informationen finden Sie unter Datenaufbereitung mit SQL in Studio.
Themen
Terminologie und Konzepte
Bevor Sie mit der Nutzung von SageMaker Assets beginnen, sollten Sie sich mit den folgenden Begriffen und Konzepten vertraut machen:
-
Asset — Die Metadaten, die auf die Modelle oder Datentabellen verweisen, die Sie teilen. Sie beantragen entweder Zugriff auf ein Asset, das jemand anderem gehört, oder Sie teilen Ihr Asset mit anderen. Sie und Ihre Teamkollegen greifen auf das Asset und die zugrunde liegende Datentabelle oder das zugehörige Modell zu.
-
Abonnierte Ressourcen — Um Zugriff auf ein Asset zu beantragen, reichen Sie eine Abonnementanfrage ein. Wenn Ihre Anfrage genehmigt wurde, wird das Asset unter Ihren abonnierten Assets angezeigt.
-
Eigene Vermögenswerte — Die Vermögenswerte, die Sie mit Ihren Teamkollegen geteilt haben.
-
Asset-Katalog — Die Ressourcen, die Sie in Ihrer Organisation gemeinsam genutzt haben.
Schritt 1: Greifen Sie auf SageMaker Assets zu
Greifen Sie auf SageMaker Assets zu, um Ihre Ressourcen anzusehen und mit anderen zu teilen. Verwenden Sie die folgenden Informationen, um mit der Nutzung zu beginnen.
Sie greifen von einem Projekt innerhalb einer Amazon DataZone-Domain aus auf SageMaker Assets zu. Ein Projekt ist eine Zusammenarbeit zwischen Ihnen und Ihren Teammitgliedern. Innerhalb des Projekts haben Sie und die anderen Mitglieder Ihres Projekts Zugriff auf die Assets, die Sie und Ihre anderen Teammitglieder im Inventarkatalog erstellen. Sie können die Assets im veröffentlichten Katalog veröffentlichen, um sie für andere Personen in Ihrer Organisation sichtbar zu machen.
Diese Personen können Zugriff auf Ihr Asset beantragen. Wenn Sie ihnen Zugriff gewähren, können sie Zugriff auf die aktualisierte Datenquelle erhalten. Wenn eine Person beispielsweise eine AWS Glue Tabelle abonniert, die Sie aktualisieren, kann sie in Echtzeit auf die aktualisierte AWS Glue Tabelle zugreifen.
Gehen Sie wie folgt vor, um SageMaker Assets aufzurufen.
So greifen Sie auf SageMaker Assets zu
-
Öffnen Sie die Konsole Amazon DataZone
. -
Wählen Sie Domains anzeigen.
-
Wählen Sie neben der Domain, die Ihr Projekt enthält, die Option Datenportal öffnen aus.
-
Wählen Sie unter Analysetools die Option SageMaker AI Studio aus.
-
Wählen Sie Amazon SageMaker AI öffnen.
-
Wählen Sie Assets (Komponenten).
Die Inhalte, die mit Ihnen geteilt wurden, befinden sich unter Abonnierte Assets. Die Assets, die Sie und Ihre Projektmitglieder erstellen, befinden sich unter Eigene Assets. Die Assets, die Sie und die anderen Mitglieder Ihrer Organisation veröffentlicht haben, befinden sich im Asset-Katalog.
Schritt 2: Teilen Sie Ressourcen und verwalten Sie den Zugriff darauf
Nachdem Sie Modelle, Feature-Gruppen oder Datentabellen für maschinelles Lernen erstellt haben, können Sie diese für die Personen sichtbar machen, die mit Ihnen an Ihrem Projekt oder Ihrer Organisation im Allgemeinen zusammenarbeiten. Sie können auf Zugriffsanfragen für das Asset antworten. Wenn Sie die Anfrage einer Person genehmigen, kann diese Person die dem Asset zugrunde liegende Datenquelle ändern.
Beim Teilen eines Assets haben Sie zwei Möglichkeiten:
-
Im Asset-Katalog veröffentlichen — Machen Sie das Asset für jeden in Ihrer Organisation sichtbar
-
Im Inventar veröffentlichen — Machen Sie das Asset für alle sichtbar, die an Ihrem Projekt arbeiten
Wenn Sie Ihr Asset im Asset-Katalog veröffentlicht haben, können einzelne Personen in Ihrer Organisation es im Asset-Katalog finden. Sie können die Metadaten Ihres Assets einsehen und entscheiden, ob sie Zugriff darauf beantragen möchten. Wenn Sie ihre Anfrage genehmigen, erhalten sie Zugriff auf die zugrunde liegende Datenquelle.
Wenn Sie im Inventar veröffentlichen, können Sie und die anderen Mitglieder Ihres Projekts ohne weitere Maßnahmen auf das Asset zugreifen.
Im Inventar veröffentlichte Objekte werden nur unter „Eigene Objekte“ angezeigt. Im Katalog veröffentlichte Vermögenswerte werden unter Eigene Vermögenswerte und Bestandskatalog angezeigt.
Wenn Sie eine Datentabelle veröffentlichen, müssen Sie eine Datenquelle erstellen, die die Metadaten aus der zugrunde liegenden AWS Glue Tabelle oder der Amazon Redshift Redshift-Tabelle in das Asset bezieht. Verwenden Sie die folgenden Verfahren, um eine AWS Glue oder Amazon Redshift Redshift-Tabelle zu veröffentlichen.
Verwenden Sie die folgenden Verfahren, um ein Asset für eine Feature- oder Modellpaketgruppe zu veröffentlichen.
Gehen Sie wie folgt vor, um ein Asset aus Ihren eigenen Vermögenswerten im Asset-Katalog zu veröffentlichen.
Um ein Asset von der SageMaker Assets-Seite aus zu veröffentlichen
-
Navigieren Sie in Studio zu Assets.
-
Wählen Sie Eigene Vermögenswerte aus.
-
Geben Sie den Namen Ihres Assets in der Suchleiste ein.
-
Wählen Sie das Asset aus.
-
Wählen Sie Publish.
Sie können den folgenden SageMaker Python SDK-Code verwenden, um eine Featuregruppe oder Modellpaketgruppe zu veröffentlichen. In dem Code wird vorausgesetzt, dass Sie bereits die Featuregruppe oder Modellpaketgruppe erstellt haben.
from sagemaker.asset import AssetManager publisher = AssetPublisher() publisher.publish_to_catalog(name-of-your-feature-group-or-model-package)
Schritt 3: Verwalten von Zugriffsanfragen
Nachdem Sie ein Asset veröffentlicht haben, möchten Benutzer außerhalb Ihres Projekts möglicherweise darauf zugreifen. Sie können Zugriffsanfragen stellen, ablehnen oder widerrufen. Sie können auch Assets löschen, um die zugrunde liegende Datenquelle nur für Sie selbst verfügbar zu machen.
Gehen Sie wie folgt vor, um Abonnementanfragen zu beantworten.
Um Abonnementanfragen zu genehmigen
-
Navigieren Sie zur Seite SageMaker-Komponenten.
-
Wählen Sie Asset-Assets verwalten aus.
-
Wählen Sie Eingehende Abonnementanfragen aus.
-
-
(Optional) Wählen Sie Genehmigen und geben Sie einen Grund an.
-
(Optional) Wählen Sie Ablehnen.
-
Sie können den Zugriff auf ein Asset wieder aufheben, das Sie zuvor genehmigt haben. Wenn Sie sich dafür entscheiden, den Zugriff zu widerrufen, verlieren Benutzer den Zugriff sowohl auf das Asset als auch auf die zugrunde liegende Asset-Quelle. Gehen Sie wie folgt vor, um den Zugriff aufzuheben.
So heben Sie den Zugriff auf
-
Navigieren Sie zur Seite SageMaker-Komponenten.
-
Wählen Sie Asset-Assets verwalten aus.
-
Wählen Sie Eingehende Abonnementanfragen aus.
-
Wählen Sie den Tab Genehmigt aus.
-
Wählen Sie neben dem Asset die Option Widerrufen aus.
Sie können die Veröffentlichung von Assets auch rückgängig machen, sodass sie nur noch als eigene Assets angezeigt werden. Die Assets werden im Ressourcenkatalog nicht sichtbar sein, aber die Personen, deren Abonnementanfragen Sie genehmigt haben, können trotzdem darauf zugreifen.
Um die Veröffentlichung eines Assets rückgängig zu machen
-
Navigieren Sie zur Seite SageMaker-Komponenten.
-
Wählen Sie unter Eigene Inhalte das Asset aus, dessen Veröffentlichung Sie rückgängig machen möchten.
-
Wählen Sie Unpublish (Veröffentlichung aufheben).
Sie können Assets auch von derselben Seite löschen, auf der Sie die Veröffentlichung rückgängig gemacht haben. Durch das Löschen eines Assets wird die Datenquelle nicht gelöscht. Durch das Löschen eines Elements wird das Asset nur für die anderen Mitglieder Ihres Projekts oder Ihrer Organisation unsichtbar.
Schritt 4: Suchen Sie nach Ressourcen und fordern Sie Zugriff darauf an
Sie können Zugriff auf Ressourcen anfordern, die andere Benutzer im Ressourcenkatalog veröffentlicht haben. Wenn sie die Abonnementanfrage genehmigen, erhalten Sie Zugriff auf die zugrunde liegende Datenquelle.
Oben auf der Seite SageMaker Assets können Sie eine Suchabfrage angeben, um nach Assets zu suchen, die andere Benutzer in Ihrer Organisation veröffentlicht haben. Sie können auch einen Asset-Typ auswählen, um alle veröffentlichten Assets dieses Typs anzuzeigen. Sie können beispielsweise Glue Table auswählen, um alle veröffentlichten AWS Glue Tabellen anzuzeigen.
Sie können den Asset-Typ auch direkt unter dem Namen des Assets anzeigen. Es stehen die folgenden Namen für die Asset-Typen zur Verfügung:
-
Redshift-Tabellen
-
Klebetabellen
-
Modelle
-
Funktionsgruppe
Anmerkung
Feature-Gruppen in den folgenden Geschäften haben den Typ Glue-Tabelle:
-
Offline
-
Offline und online
Um eine Abonnementanfrage zu stellen
-
Navigieren Sie zur Seite SageMaker-Komponenten.
-
-
Geben Sie in der Suchleiste den Namen des Assets ein und wählen Sie Suchen aus.
-
Wählen Sie unter Typen den Asset-Typ aus und suchen Sie im Ressourcenkatalog nach einem Asset, auf das Sie zugreifen.
-
-
Wählen Sie das Asset aus.
-
Wählen Sie Subscribe (Abonnieren) aus.
-
Geben Sie einen Grund für die Anfrage an.
-
Wählen Sie Absenden aus.
Ihre Abonnementanfrage wird unter Ausgehende Abonnementanfragen unter Asset-Anfragen verwalten angezeigt. Wenn der Herausgeber des Assets Ihre Anfrage genehmigt, wird sie unter Abonnierte Inhalte angezeigt. Sie können jetzt die Amazon Redshift-, AWS Glue Table- oder ML-Datenquelle in Ihren Machine-Learning-Workflows verwenden.
Schritt 5: Verwenden Sie ein gemeinsam genutztes Asset in Ihren Workflows für maschinelles Lernen
Wenn Ihre Abonnementanfrage für ein Asset genehmigt wurde, können Sie es in Ihren Workflows für maschinelles Lernen verwenden.
Die Funktionsgruppen, auf die Sie Zugriff erhalten haben, werden in Ihrer Liste der Funktionsgruppen in Studio angezeigt.
Die Modellgruppen, auf die Sie Zugriff erhalten haben, werden in Ihrer Liste der Modellgruppen in Studio angezeigt. Sie können Ihre Modellgruppe in der Modellregistrierung von SageMaker Assets aus öffnen. Gehen Sie wie folgt vor, um die Modellgruppe in der Modellregistrierung zu öffnen. Abonnierte Anlagen.
So öffnen Sie eine Modellgruppe aus SageMaker Assets
-
Wählen Sie die Modellgruppe aus.
-
Wählen Sie In Model Registry öffnen.
Sie können auf Amazon Redshift Redshift-Tabellen in Data Wrangler in SageMaker Canvas zugreifenAWS Glue. SageMaker Canvas ist eine Anwendung, mit der Sie explorative Datenanalysen (EDA) durchführen und Modelle ohne Code trainieren können. Weitere Informationen zu SageMaker Canvas finden Sie unter Amazon SageMaker Canvas.
Mithilfe der SQL-Erweiterung können Sie auch die Daten aus Ihren AWS Glue oder Amazon Redshift Redshift-Tabellen in Ihre Jupyter-Notebooks importieren. Sie können Ihre Daten in Pandas-Datenrahmen für Ihre maschinellen Lern-Workflows konvertieren. Weitere Informationen finden Sie unter Datenaufbereitung mit SQL in Studio.