Interrogation des vecteurs
Note
Amazon S3 Vectors est en version préliminaire pour Amazon Simple Storage Service et sujet à modification.
Vous pouvez exécuter une requête de similarité à l’aide de l’opération d’API QueryVectors, dans laquelle vous spécifiez le vecteur de requête, le nombre de résultats pertinents à renvoyer (les 1 000 voisins les plus proches) et l’ARN de l’index. En outre, vous pouvez utiliser des filtres de métadonnées dans une requête pour rechercher uniquement les vecteurs correspondant au filtre. Si vous faites une demande de filtrage sur un champ de métadonnées non filtrable, la demande renverra une erreur 400 Bad
Request. Pour plus d’informations sur le filtrage des métadonnées, consultez Filtrage de métadonnées.
Dans la réponse, les clés vectorielles sont renvoyées par défaut. Vous pouvez éventuellement inclure la distance et les métadonnées dans la réponse.
Lorsque vous générez le vecteur de requête, vous devez utiliser le même modèle de vectorisation que celui utilisé pour générer les vecteurs initiaux stockés dans l’index de vecteur. Par exemple, si vous utilisez le modèle de plongement lexical Amazon Titan V2 dans Amazon Bedrock pour générer des vectorisations de vos documents, utilisez le même modèle de vectorisation pour convertir une question en vecteur de requête. En outre, les bases de connaissances d’Amazon Bedrock fournissent un flux de travail RAG de bout en bout entièrement géré dans lequel Amazon Bedrock récupère automatiquement les données de votre source de données S3, convertit le contenu en blocs de texte, génère des vectorisations et les stocke dans votre index vectoriel. Vous pouvez ensuite interroger la base de connaissances et générer des réponses basées sur des blocs récupérés de vos données sources. Pour plus d’informations sur l’interrogation des vecteurs à partir d’une base de connaissances d’Amazon Bedrock dans la console, consultez (Facultatif) Intégrez S3 Vectors aux bases de connaissances d’Amazon Bedrock.
En outre, l’outil open source Amazon S3 Vectors Embed CLI fournit un moyen simplifié d’effectuer des recherches sémantiques à partir de la ligne de commande. Cet outil open source rationalise le processus de requête en gérant à la fois la génération de vectorisation avec les modèles de fondation Amazon Bedrock et en exécutant des opérations de recherche sémantique sur vos index vectoriels S3. Pour plus d’informations sur l’utilisation cet outil pour interroger vos données vectorielles, consultez Création de vectorisation et réalisation de recherches sémantiques avec s3vectors-embed-cli.
S3 Vectors fournit des temps de latence de requête inférieurs à une seconde. S3 Vectors utilise le débit élastique d’Amazon S3 pour gérer les recherches sur des millions de vecteurs et est idéal pour les charges de travail où les requêtes sont moins fréquentes. Lorsque vous effectuez des requêtes de similarité pour vos vectorisations, plusieurs facteurs peuvent affecter les performances de rappel moyennes, notamment le modèle de vectorisation, la taille du jeu de données vectorielles (le nombre de vecteurs et de dimensions) et la distribution des requêtes. S3 Vectors fournit un taux de rappel moyen supérieur à 90 % pour la plupart des jeux de données. Le rappel moyen mesure la qualité des résultats des requêtes. Un rappel moyen de 90 % signifie que la réponse contient 90 % des vecteurs les plus proches réels (vérité fondamentale) qui sont stockés dans l’index vectoriel relatif au vecteur de requête. Cependant, étant donné que les performances réelles peuvent varier en fonction de vos cas d’utilisation spécifiques, nous vous recommandons d’effectuer vos propres tests avec des données et des requêtes représentatives afin de valider que S3 Vectors répond à vos exigences de rappel.