Verwenden von Amazon SageMaker Feature Store in der Konsole
Wichtig
Benutzerdefinierte IAM-Richtlinien, die es Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ermöglichen, Amazon-SageMaker-Ressourcen zu erstellen, müssen auch Berechtigungen zum Hinzufügen von Tags zu diesen Ressourcen gewähren. Die Berechtigung zum Hinzufügen von Tags zu Ressourcen ist erforderlich, da Studio und Studio Classic automatisch alle von ihnen erstellten Ressourcen taggen. Wenn eine IAM-Richtlinie Studio und Studio Classic das Erstellen von Ressourcen, aber kein Tagging erlaubt, können bei dem Versuch, Ressourcen zu erstellen, „AccessDenied“-Fehler auftreten. Weitere Informationen finden Sie unter Bereitstellen von Berechtigungen für das Markieren von SageMaker-AI-Ressourcen.
Verwaltete AWS-Richtlinien für Amazon SageMaker AI, die Berechtigungen zum Erstellen von SageMaker-Ressourcen gewähren, enthalten bereits Berechtigungen zum Hinzufügen von Tags während der Erstellung dieser Ressourcen.
Sie können Amazon SageMaker Feature Store auf der Konsole verwenden, um Ihre Funktionsgruppen zu erstellen, anzuzeigen, zu aktualisieren und zu überwachen. Die Überwachung in diesem Handbuch umfasst die Anzeige der Pipeline-Ausführungen und der Herkunft Ihrer Funktionsgruppen. Dieses Handbuch enthält Anweisungen dazu, wie Sie diese Aufgaben von der Konsole aus ausführen können.
Beispiele und Ressourcen für Feature Store, die die Amazon-SageMaker-APIs und AWS SDK für Python (Boto3) verwenden, finden Sie unter Amazon-SageMaker-Feature-Store-Ressourcen.
Themen
Erstellen einer Feature-Gruppe von der Konsole aus
Der Prozess zur Erstellung von Feature-Gruppen umfasst vier Schritte:
-
Geben Sie Informationen zur Featuregruppe ein.
-
Geben Sie Feature-Definitionen ein.
-
Geben Sie die erforderlichen Funktionen ein.
-
Geben Sie Feature-Gruppen-Tags ein.
Überlegen Sie, welche der folgenden Optionen am besten zu Ihrem Anwendungsfall passt:
-
Erstellen Sie einen Online-Speicher, einen Offline-Speicher oder beides. Weitere Informationen zu den Unterschieden zwischen Online- und Offline-Speichern finden Sie unter Feature Store-Konzepte.
-
Verwenden Sie einen AWS Key Management Service Standardschlüssel oder Ihren eigenen KMS-Schlüssel. Der Standardschlüssel ist AWS KMSkey (SSE-KMS). Sie können die Kosten für AWS KMS Anfragen reduzieren, indem Sie die Verwendung von Amazon S3 Bucket Keys im Amazon-S3-Bucket im Offline-Speicher konfigurieren. Der Bucket-Schlüssel von Amazon S3 muss aktiviert werden, bevor Sie den Bucket für Ihre Feature-Gruppen verwenden können. Weitere Informationen zum Verwenden von Bucket-Schlüsseln von Amazon S3 finden Sie unter Reduzieren der Kosten für SSE-KMS mit Bucket-Schlüsseln von Amazon S3.
Sie können denselben Schlüssel sowohl für Online- als auch für Offline-Speichers verwenden oder für jeden einen eigenen Schlüssel verwenden. Mehr über AWS KMS erfahren Sie unter AWS Key Management Service.
-
Bei der Erstellung eines Offline-Speichers:
-
Entscheiden Sie, ob Sie einen Amazon-S3-Bucket erstellen oder einen vorhandenen verwenden möchten. Wenn Sie ein vorhandenes verwenden, müssen Sie die Bucket-URL oder den Bucket-Namen von Amazon S3 und gegebenenfalls den Namen des Datensatz-Verzeichnisses kennen.
-
Wählen Sie den Amazon-Ressourcennamen (ARN) aus, den Sie zum Angeben der IAM-Rolle verwenden möchten. Weitere Informationen dazu, wie Sie Ihre Rolle und die zugehörigen Richtlinien finden Sie unter Hinzufügen von Richtlinien zu Ihrer IAM-Rolle.
-
Entscheiden Sie, ob Sie das Tabellenformat AWS Glue (Standard) oder Apache Iceberg verwenden möchten. In den meisten Anwendungsfällen verwenden Sie das Apache Iceberg-Tabellenformat. Weitere Informationen zur Tabellenformaten finden Sie unter Verwenden Sie Feature Store mit SDK for Python (Boto3).
-
Sie können die Konsole verwenden, um die Herkunft einer Feature-Gruppe anzeigen. Die Anweisungen für die Verwendung von Feature Store auf der Konsole hängen davon ab, ob Sie den Feature Store aktiviert haben Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ob es sich um Ihr Standardkonfiguration handelt.
-
Öffnen Sie die Studio-Konsole, indem Sie den Anweisungen unter folgenStarten von Amazon SageMaker Studio.
-
Wählen Sie im linken Navigationsbereich Daten aus, um die Dropdownliste zu erweitern.
-
Wählen Sie aus der Dropdown-Liste Feature Store.
-
Wählen Sie Feature-Gruppe erstellen aus.
-
Geben Sie unter Featuregruppendetails einen Namen für die Featuregruppe ein.
-
(Optional) Geben Sie eine Beschreibung für den Auftrag ein.
-
Wählen Sie unter Speicherkonfiguration der Feature-Gruppe eine Speicherkonfiguration aus der Dropdown-Liste aus. Weitere Informationen zum Konfigurieren des Speichers finden Sie unter Feature Store Speicherkonfigurationen.
-
Wenn Sie sich dafür entschieden haben, den Online-Speicher zu aktivieren:
-
Wenn Sie nur den Online-Speicher aktivieren, können Sie einen Speichertyp aus der Dropdown-Liste auswählen. Informationen zu den Speichertypen des Onlineshops finden Sie unterOnline-Geschäft.
-
(Optional) Wenden Sie Time to Live (TTL) an, indem Sie den Schalter auf Ein stellen und den Wert und die Einheit für die Gültigkeitsdauer und die Einheit für die Gültigkeitsdauer angeben. Dadurch wird die Standard-TTL-Dauer für alle Datensätze aktualisiert, die der Feature-Gruppe hinzugefügt wurden, nachdem die Feature-Gruppe erstellt wurde. Weitere Informationen zu TTL finden Sie unter Time To Live (TTL), Gültigkeitsdauer der Verbindung.
-
-
Wenn Sie sich dafür entschieden haben, den Offline-Speicher zu aktivieren:
-
Geben Sie unter dem Amazon S3 S3-Bucket-Namen einen neuen Bucket-Namen oder eine bestehende Bucket-URL manuell ein.
-
Wählen Sie aus der Dropdown-Liste Tabellenformat das Tabellenformat aus. In den meisten Anwendungsfällen sollten Sie das Apache Iceberg-Tabellenformat verwenden. Weitere Informationen zur Tabellenformaten finden Sie unter Verwenden Sie Feature Store mit SDK for Python (Boto3).
-
Wählen Sie unter IAM-Rollen-ARN den IAM-Rollen-ARN aus, den Sie dieser Featuregruppe zuordnen möchten. Weitere Informationen dazu, wie Sie Ihre Rolle und die zugehörigen Richtlinien finden Sie unter Hinzufügen von Richtlinien zu Ihrer IAM-Rolle.
-
Wenn Sie sich dafür entschieden haben, das Tabellenformat und das AWS Glue (Standard-) Tabellenformat für den Offline-Speicher zu aktivieren, können Sie unter Datenkatalog eine der folgenden beiden Optionen wählen:
-
Verwenden Sie Standardwerte für Ihre AWS Glue Data Catalog.
-
Geben Sie Ihren vorhandenen Datenkatalognamen, Tabellennamen und Datenbanknamen an, um Ihren vorhandenen zu erweiternAWS Glue Data Catalog.
-
-
-
Wählen Sie in der Dropdownliste Verschlüsselungsschlüssel für Onlineshops oder Verschlüsselungsschlüssel für Offline-Speicher eine der folgenden Optionen aus:
-
AWSVerwaltet verwenden AWS KMS key (Standard)
-
Geben Sie einen AWS KMS key ARN ein und geben Sie Ihren AWS KMS Schlüssel-ARN unter Verschlüsselungsschlüssel ARN für Offline-Speicher ein. Weitere Informationen zu AWS KMS finden Sie unter AWSKey Management Service.
-
-
Falls zutreffend, haben Sie die Möglichkeit, Ihren Durchsatzmodus zu wählen, der sich darauf auswirkt, wie Ihnen die Kosten berechnet werden. Wählen Sie unter Durchsatzmodus einen Modus aus der Dropdownliste aus und geben Sie die Lese- und Schreibkapazitäten ein, sofern verfügbar. Informationen zu den Durchsatzmodi, z. B. wann der Modus angewendet werden kann und zu den Kapazitätseinheiten, finden Sie unterDurchsatzmodi.
-
Nachdem Sie alle erforderlichen Informationen angegeben haben, wird die Schaltfläche Weiter angezeigt. Klicken Sie auf Weiter.
-
Unter Featuredefinitionen angeben haben Sie zwei Möglichkeiten, ein Schema für Ihre Features bereitzustellen: einen JSON-Editor oder einen Tabelleneditor.
-
JSON-Editor: Geben Sie Ihre Feature-Definitionen im JSON-Format in die Registerkarte JSON ein oder kopieren Sie sie dorthin.
-
Tabelleneditor: Geben Sie auf der Registerkarte Tabelle den Namen des Features ein und wählen Sie den entsprechenden Datentyp für jedes Feature in Ihrer Feature-Gruppe aus. Wählen Sie + Feature-Definitionen hinzufügen, um weitere Features einzubeziehen. Beachten Sie, dass Sie Feature-Definitionen nicht aus Ihren Feature-Gruppen entfernen können. Sie können Feature-Definitionen jedoch hinzufügen und aktualisieren, nachdem die Feature-Gruppe erstellt wurde.
Eine Feature-Gruppe muss mindestens zwei Features enthalten, die die Datensatz-ID und die Uhrzeit des Ereignisses repräsentieren:
-
Der Datensatz Feature-Typ kann eine Zeichenfolge, eine Bruchzahl oder eine Ganzzahl sein.
-
Die Ereigniszeit Feature-Typ muss eine Zeichenfolge oder ein Bruch sein. Wenn Sie jedoch das Iceberg-Tabellenformat wählen, muss es sich bei der Ereigniszeit um eine Zeichenfolge handeln.
-
-
Sobald alle Funktionen enthalten sind, wählen Sie Weiter aus.
-
Unter Wählen Sie die erforderlichen Funktionen aus, müssen Sie die Datensatzkennung und die Ereigniszeit angeben. Wählen Sie dazu den Feature-Namen in den Dropdown-Listen Record Identifier Feature Name und Event Time Feature Name den Feature-Namen.
-
Nachdem Sie die Features für die Datensatzkennung und die Ereigniszeit ausgewählt haben, wählen Sie Weiter aus.
-
(Optional) Um Tags für die Feature-Gruppe hinzuzufügen, wählen Sie Neues Tag hinzufügen. Geben Sie dann einen Tag-Schlüssel und den entsprechenden Wert unter Schlüssel bzw. Wert ein.
-
Klicken Sie auf Weiter.
-
Überprüfen Sie unter Feature-Gruppe überprüfen die Informationen zur Featuregruppe. Um einen Schritt zu bearbeiten, wählen Sie die Schaltfläche Bearbeiten aus, die diesem Schritt entspricht. Dadurch gelangen Sie zum entsprechenden Schritt für die Bearbeitung. Um zu Schritt 5 zurückzukehren, wählen Sie Weiter, bis Sie zu Schritt 5 zurückkehren.
-
Nachdem Sie die Einrichtung für Ihre Feature-Gruppe abgeschlossen haben, wählen Sie Feature-Gruppe erstellen aus.
Wenn während der Einrichtung ein Problem auftritt, wird unten auf der Seite eine Popup-Meldung mit Tipps zur Lösung des Problems angezeigt. Sie können zu den vorherigen Schritten zurückkehren, um die Probleme zu beheben, indem Sie für den Schritt mit Konflikten Bearbeiten auswählen.
Nachdem die Feature-Gruppe erfolgreich erstellt wurde, wird unten auf der Seite eine grüne Pop-up-Meldung angezeigt. Die neue Feature-Gruppe wird auch in Ihrem Feature-Gruppenkatalog angezeigt.
Details zur Featuregruppe von der Konsole aus anzeigen
Sie können die Details Ihrer Feature-Gruppen anzeigen, nachdem eine Feature-Gruppe erfolgreich im Feature Store erstellt wurde.
Sie können die Konsole oder die Amazon SageMaker Feature Store API verwenden, um die Details Ihrer Feature-Gruppe anzuzeigen. Die Anweisungen für die Nutzung des Feature Store über die Konsole hängen davon ab, ob Sie den Feature Store aktiviert haben Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ob es sich um Ihr Standardkonfiguration handelt.
-
Öffnen Sie die Studio-Konsole, indem Sie den Anweisungen unter folgenStarten von Amazon SageMaker Studio.
-
Wählen Sie im linken Navigationsbereich Daten aus, um die Dropdownliste zu erweitern.
-
Wählen Sie aus der Dropdown-Liste Feature Store.
-
(Optional) Um Ihre Feature-Gruppen anzuzeigen, wählen Sie Mein Konto aus. Um gemeinsam genutzte Funktionsgruppen anzuzeigen, wählen Sie Kontoübergreifend aus.
-
Wählen Sie auf der Registerkarte Feature-Gruppenkatalog den Namen Ihrer Feature-Gruppe aus der Liste aus. Dadurch wird die Feature-Gruppen-Seite geöffnet.
-
Auf der Registerkarte Funktionen finden Sie eine Liste aller Funktionen. Verwenden Sie den Filter, um Ihre Liste zu verfeinern. Wählen Sie ein Feature aus, um dessen Details anzuzeigen.
-
Auf der Registerkarte Details und der Unterregisterkarte Informationen können Sie die Informationen der Feature-Gruppe überprüfen. Dazu gehören Letzte Ausführung, Offline-Speichereinstellungen, Online-Speichereinstellungen und mehr.
-
Auf der Registerkarte Details und der Unterregisterkarte Tags können Sie die Informationen der Feature-Tags überprüfen. Wählen Sie Neues Tag hinzufügen, um ein neues Tag hinzuzufügen, oder Entfernen, um ein Tag zu entfernen.
-
Auf der Registerkarte Pipeline-Ausführungen können Sie die zugehörigen Pipelines oder Pipeline-Ausführungen für Ihre Featuregruppe anzeigen.
-
Auf der Registerkarte Herkunft können Sie die Herkunft Ihrer Feature-Gruppe einsehen.
Aktualisieren Sie eine Featuregruppe von der Konsole aus
Sie können Ihre Feature-Gruppen aktualisieren, nachdem eine Feature-Gruppe erfolgreich im Feature Store erstellt wurde.
Sie können die Konsole oder die Amazon SageMaker Feature Store-API verwenden, um eine Feature-Gruppe zu aktualisieren. Die Anweisungen für die Nutzung des Feature Store über die Konsole hängen davon ab, ob Sie den Feature Store aktiviert haben Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ob es sich um Ihr Standardkonfiguration handelt.
-
Öffnen Sie die Studio-Konsole, indem Sie den Anweisungen unter folgenStarten von Amazon SageMaker Studio.
-
Wählen Sie im linken Navigationsbereich Daten aus, um die Dropdownliste zu erweitern.
-
Wählen Sie aus der Dropdown-Liste Feature Store.
-
(Optional) Um Ihre Feature-Gruppen anzuzeigen, wählen Sie Mein Konto aus. Um gemeinsam genutzte Funktionsgruppen anzuzeigen, wählen Sie Kontoübergreifend aus.
-
Suchen Sie auf der Registerkarte Feature-Gruppenkatalog nach Ihrem Feature-Gruppennamen und wählen Sie ihn aus der Liste aus. Dadurch wird die Feature-Gruppen-Seite geöffnet.
-
Wählen Sie Featuregruppe aktualisieren aus.
-
(Optional) Falls zutreffend, können Sie Ihren Durchsatzmodus ändern, was sich auf die Abrechnung auswirkt. Wählen Sie unter Durchsatzmodus einen Modus aus der Dropdownliste aus und geben Sie die Lese- und Schreibkapazitäten ein, sofern verfügbar. Informationen zu den Durchsatzmodi, z. B. wann der Modus angewendet werden kann und zu den Kapazitätseinheiten, finden Sie unterDurchsatzmodi.
-
(Optional) Wenn Ihre Featuregruppe den Onlineshop verwendet, können Sie die Standard-Time to Live (TTL) aktualisieren. Wenn TTL für die Featuregruppe nicht aktiviert wurde, stellen Sie den Schalter unter Time to Live (TTL) auf On. Sie können den TTL-Wert und die Einheit unter Time-to-Live-Dauer angeben. Dadurch wird die Standard-TTL-Dauer für alle Datensätze aktualisiert, die der Feature-Gruppe hinzugefügt wurden, nachdem die Feature-Gruppeaktualisiert wurde.
-
(Optional) Sie können Ihrer Feature-Gruppe Feature-Definitionen hinzufügen, beachten Sie jedoch, dass Sie Feature-Definitionen nicht aus Ihren Feature-Gruppen entfernen können. Um eine Feature-Definition hinzuzufügen, wählen Sie + Feature-Definition hinzufügen und geben Sie dann den Namen der neuen Feature-Definition in der Spalte Name an und wählen Sie den Feature-Typ in der Spalte Feature-Typ aus.
-
Wählen Sie Änderungen speichern aus.
-
Wählen Sie Bestätigen aus, um Ihre Änderungen zu bestätigen.
Pipeline-Ausführungen von der Konsole aus anzeigen
Unter Pipeline-Ausführungen finden Sie die neuesten Informationen zur Pipeline-Ausführung. Sie können auch Links zu Pipelines, Ausführungen, Code und anderen nützlichen Ausführungsinformationen abrufen.
Sie können die -Konsole verwenden, um Ihre Pipeline-Ausführungen anzuzeigen. Die Anweisungen für die Nutzung des Feature Store über die Konsole hängen davon ab, ob Sie den Feature Store aktiviert haben Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ob es sich um Ihr Standardkonfiguration handelt.
-
Öffnen Sie die Studio-Konsole, indem Sie den Anweisungen unter folgenStarten von Amazon SageMaker Studio.
-
Wählen Sie im linken Navigationsbereich Daten aus, um die Dropdownliste zu erweitern.
-
Wählen Sie aus der Dropdown-Liste Feature Store.
-
(Optional) Um Ihre Feature-Gruppen anzuzeigen, wählen Sie Mein Konto aus. Um gemeinsam genutzte Funktionsgruppen anzuzeigen, wählen Sie Kontoübergreifend aus.
-
Wählen Sie eine Feature-Gruppe oder ein Feature aus, um deren Pipeline-Ausführungen anzuzeigen.
-
Wählen Sie die Registerkarte Pipeline-Ausführungen.
-
Suchen Sie in der Dropdown-Liste Pipeline auswählen nach einer Pipeline.
-
Sie können die Links für die Pipeline, die Ausführung und die Codedetails anzeigen. Sie können auch den Eigentümer, den Status, das Datum und die Dauer der Ausführung anzeigen.
Lineage von der Konsole aus anzeigen
Sie können die Herkunft einer Feature-Gruppe anzeigen. Die Herkunft umfasst Informationen über den Ausführungscode Ihres Workflows zur Feature-Verarbeitung, welche Datenquellen verwendet wurden und wie sie in die Feature-Gruppe oder das Feature aufgenommen wurden.
Sie können die Konsole verwenden, um die Herkunft einer Feature-Gruppe anzeigen. Die Anweisungen zur Verwendung des Feature Store über die Konsole hängen davon ab, ob Sie den Feature Store aktiviert haben Amazon SageMaker Studio oder Amazon SageMaker Studio Classic als Standardversion.
-
Öffnen Sie die Studio-Konsole, indem Sie den Anweisungen unter folgenStarten von Amazon SageMaker Studio.
-
Wählen Sie im linken Navigationsbereich Daten aus, um die Dropdownliste zu erweitern.
-
Wählen Sie aus der Dropdown-Liste Feature Store.
-
(Optional) Um Ihre Feature-Gruppen anzuzeigen, wählen Sie Mein Konto aus. Um gemeinsam genutzte Funktionsgruppen anzuzeigen, wählen Sie Kontoübergreifend aus.
-
Wählen Sie eine Feature-Gruppe oder ein Feature aus, um dessen Herkunftsdetails anzuzeigen.
-
Wählen Sie die Registerkarte Herkunft.
-
Wählen Sie eine Feature-Gruppe oder einen Pipeline-Knoten aus, um den Knoten zu erweitern. Dies enthält weitere Informationen zu einer Feature-Gruppe oder Pipeline.
-
Sie können das Liniendiagramm vergrößern, verkleinern oder neu zentrieren, indem Sie die Schaltflächen unten links auf dem Bildschirm verwenden.
-
Sie können sich durch die Lineage-Map bewegen, wenn Sie den Bildschirm auswählen und ziehen. Wenn Sie Ihre Linienkarten mithilfe von Knoten als Mittelpunkt verschieben möchten, können Sie die Tabulatortaste oder Umschalttaste+Tabulatortaste drücken, um zwischen den Knoten zu wechseln.
-
Falls zutreffend, können Sie durch die Herkunft flussaufwärts (links, früher) oder flussabwärts (rechts, zuletzt) navigieren. Wählen Sie dazu einen Knoten aus und wählen Sie dann Upstream-Herkunft abfragen oder Downstream-Herkunft abfragen.