Index vectoriels
Note
Amazon S3 Vectors est en version préliminaire pour Amazon Simple Storage Service et sujet à modification.
Note
Choisissez soigneusement les paramètres de configuration de votre index vectoriel. Après avoir créé un index vectoriel, vous ne pouvez pas mettre à jour le nom de l’index vectoriel, la dimension, la métrique de distance ou les clés de métadonnées non filtrables. Pour modifier l’une de ces valeurs, vous devez créer un nouvel index vectoriel.
Les index vectoriels sont des ressources au sein d’un compartiment de vecteur qui stockent et organisent les données vectorielles pour des opérations de recherche de similarité efficaces. Lorsque vous créez un index vectoriel, vous spécifiez la métrique de distance (Cosine ou Euclidean), le nombre de dimensions qu’un vecteur doit avoir et, éventuellement, une liste de champs de métadonnées que vous souhaitez exclure du filtrage lors des requêtes de similarité.
Pour plus d’informations sur les limites d’index vectoriel par compartiment, les limites vectorielles par index et les limites de dimension par vecteur, consultez Limites et restrictions.
Chaque index vectoriel possède un Amazon Resource Name (ARN) unique. Les ARN des index vectoriels suivent le format suivant :
arn:aws:s3vectors:region:account-id:bucket/bucket-name/index/index-name
Exigences relatives à la dénomination des index vectoriels
-
Les noms d’index vectoriel doivent être uniques dans le compartiment de vecteur.
-
Les noms d’index vectoriel peuvent comporter entre 3 et 63 caractères.
-
Les caractères valides sont les lettres minuscules (a-z), les chiffres (0-9), les tirets (-) et les points (.).
-
Les noms d’index vectoriel doivent commencer et se terminer par une lettre ou un chiffre.
Exigences relatives aux dimensions
Une dimension est le nombre de valeurs d’un vecteur. Tous les vecteurs ajoutés à l’index doivent avoir exactement ce nombre de valeurs.
-
Une dimension doit être un entier compris entre 1 et 4 096.
-
Une plus grande dimension nécessite plus d’espace de stockage.
Options de métrique de distance
La métrique de distance spécifie le mode de calcul de la similitude entre les vecteurs. Lorsque vous créez des vectorisations, choisissez la métrique de distance recommandée pour votre modèle de vectorisation pour des résultats plus précis.
-
Cosinus : mesure le cosinus de l’angle entre les vecteurs. Idéal pour les vecteurs normalisés et lorsque la direction compte plus que la magnitude.
-
Euclidien : mesure la distance en ligne droite entre les vecteurs. Idéal lorsque la direction et la magnitude sont importantes.
Clés de métadonnées non filtrables
Les clés de métadonnées vous permettent d’associer des informations supplémentaires à vos vecteurs sous forme de paires clé-valeur lors du stockage et de la récupération. Par défaut, toutes les métadonnées sont filtrables. Vous pouvez donc les utiliser pour filtrer les résultats des requêtes. Toutefois, vous pouvez désigner des clés de métadonnées spécifiques comme non filtrables lorsque vous souhaitez stocker des informations à l’aide de vecteurs sans les utiliser pour le filtrage.
Contrairement aux clés de métadonnées par défaut, ces clés ne peuvent pas être utilisées comme filtres de requête. Les clés de métadonnées non filtrables peuvent être récupérées mais ne peuvent pas être recherchées, interrogées ou filtrées. Vous ne pouvez y accéder qu’après avoir trouvé l’index.
Les clés de métadonnées non filtrables vous permettent d’enrichir les vecteurs avec du contexte supplémentaire que vous souhaitez récupérer avec les résultats de recherche sans avoir besoin de filtrer. Un exemple courant de clé de métadonnées non filtrable est lorsque vous incorporez du texte dans des vecteurs et que vous souhaitez inclure le texte original lui-même en tant que métadonnées non filtrables. Cela vous permet de renvoyer le texte source à côté des résultats de recherche vectorielle sans augmenter les limites de taille des métadonnées filtrables. D’autres exemples incluent le stockage des horodatages de création, des URL sources ou des informations descriptives uniquement à titre de référence. Les clés de métadonnées non filtrables sont accessibles lors de la récupération de vecteurs mais, contrairement aux clés de métadonnées par défaut, elles ne peuvent pas être utilisées comme filtres de requête.
Les exigences relatives aux clés de métadonnées non filtrables sont les suivantes.
-
Les clés de métadonnées non filtrables doivent être uniques dans l’index vectoriel.
-
Les clés de métadonnées non filtrables doivent comporter entre 1 et 63 caractères.
-
Les clés de métadonnées non filtrables ne peuvent pas être modifiées une fois que l’index vectoriel a été créé.
-
S3 Vectors prend en charge jusqu’à 10 clés de métadonnées non filtrables par index.
Pour plus d’informations sur les clés de métadonnées non filtrables, consultez Métadonnées non filtrables.