Vektor-Indizes
Anmerkung
Amazon S3 Vectors befindet sich in der Vorabversion für Amazon Simple Storage Service und unterliegt noch Änderungen.
Anmerkung
Wählen Sie Ihre Konfigurationsparameter für den Vektorindex sorgfältig aus. Nachdem Sie einen Vektorindex erstellt haben, können Sie den Namen, die Dimension, die Entfernungsmetrik oder die nicht filterbaren Metadatenschlüssel des Vektorindexes nicht mehr aktualisieren. Um einen dieser Werte zu ändern, müssen Sie einen neuen Vektorindex erstellen.
Vektorindizes sind Ressourcen innerhalb von Vektor-Buckets, die Vektordaten speichern und organisieren, um effiziente Ähnlichkeitssuchen zu ermöglichen. Wenn Sie einen Vektorindex erstellen, geben Sie die Entfernungsmetrik (Cosine oder Euclidean), die Anzahl der Dimensionen, die ein Vektor haben soll, und optional eine Liste von Metadatenfeldern an, die Sie bei Ähnlichkeitsabfragen von der Filterung ausschließen möchten.
Weitere Informationen zu Vektorindex-Grenzwerten pro Bucket, Vektorgrenzwerte pro Index und Dimensionsgrenzwerte pro Vektor finden Sie unter Begrenzungen und Einschränkungen.
Jeder Vektorindex verfügt über einen eindeutigen Amazon-Ressourcenname (ARN). Die ARNs von Vektorindizes haben das folgende Format:
arn:aws:s3vectors:region:account-id:bucket/bucket-name/index/index-name
Anforderungen an die Benennung von Vektorindizes
-
Namen von Vektorindizes müssen innerhalb des Vektor-Buckets eindeutig sein.
-
Vektor-Index-Namen müssen zwischen 3 und 63 Zeichen lang sein.
-
Gültige Zeichen sind Kleinbuchstaben (a–z), Ziffern (0–9), Bindestriche (-) und Punkte (.).
-
Vektorindexnamen müssen mit einem Buchstaben oder einer Zahl beginnen und enden.
Anforderungen an Dimensionen
Eine Dimension ist die Anzahl der Werte in einem Vektor. Alle dem Index hinzugefügten Vektoren müssen genau diese Anzahl von Werten haben.
-
Eine Dimension muss eine ganze Zahl zwischen 1 und 4096 sein.
-
Eine größere Dimension erfordert mehr Speicherplatz.
Optionen für Entfernungsmetriken
Die Distanzmetrik legt fest, wie die Ähnlichkeit zwischen Vektoren berechnet wird. Wählen Sie bei der Erstellung von Vektoreinbettungen die von Ihrem Einbettungsmodell empfohlene Entfernungsmetrik, um genauere Ergebnisse zu erzielen.
-
Kosinus – Misst den Kosinus des Winkels zwischen Vektoren. Ideal für normalisierte Vektoren und wenn die Richtung wichtiger ist als die Größe.
-
Euklidisch – Misst den geradlinigen Abstand zwischen Vektoren. Am besten, wenn sowohl Richtung als auch Größe wichtig sind.
Nicht filterbare Metadaten-Schlüssel
Mithilfe von Metadatenschlüsseln können Sie Ihren Vektoren beim Speichern und Abrufen zusätzliche Informationen als Schlüssel-Wert-Paare hinzufügen. Standardmäßig sind alle Metadaten filterbar, sodass Sie sie zum Filtern von Abfrageergebnissen verwenden können. Sie können jedoch bestimmte Metadatenschlüssel als nicht filterbar kennzeichnen, wenn Sie Informationen mit Vektoren speichern möchten, ohne sie zum Filtern zu verwenden.
Im Gegensatz zu Standard-Metadatenschlüsseln können diese Schlüssel nicht als Abfragefilter verwendet werden. Nicht filterbare Metadatenschlüssel können abgerufen, aber nicht gesucht, abgefragt oder gefiltert werden. Sie können erst darauf zugreifen, nachdem Sie den Index gefunden haben.
Mit nicht filterbaren Metadatenschlüsseln können Sie Vektoren mit zusätzlichem Kontext anreichern, den Sie mit Suchergebnissen abrufen möchten, aber nicht filtern müssen. Ein gängiges Beispiel für einen nicht filterbaren Metadatenschlüssel ist, wenn Sie Text in Vektoren einbetten und den Originaltext selbst als nicht filterbare Metadaten einbeziehen möchten. Auf diese Weise können Sie den Quelltext zusammen mit Vektorsuchergebnissen zurückgeben, ohne die Größenbeschränkungen für filterbare Metadaten zu erhöhen. Andere Beispiele umfassen das Speichern von Erstellungszeitstempeln, Quell-URLs oder beschreibenden Informationen, die lediglich als Referenz dienen. Beim Abrufen von Vektoren kann auf nicht filterbare Metadatenschlüssel zugegriffen werden. Im Gegensatz zu Standard-Metadatenschlüsseln können diese Schlüssel jedoch nicht als Abfragefilter verwendet werden.
Die Anforderungen für nicht filterbare Metadatenschlüssel lauten wie folgt.
-
Nicht filterbare Metadata-Schlüssel müssen innerhalb des Vektorindex eindeutig sein.
-
Nicht filterbare Metadata-Schlüssel müssen 1 bis 63 Zeichen lang sein.
-
Nicht filterbare Metadata-Schlüssel können nicht geändert werden, nachdem der Vektorindex erstellt wurde.
-
S3-Vektoren unterstützen bis zu 10 nicht filterbare Metadatenschlüssel pro Index.
Weitere Informationen zu nicht filterbaren Metadatenschlüsseln finden Sie unter Nicht filterbare Metadaten.