Vecteurs
Note
Amazon S3 Vectors est en version préliminaire pour Amazon Simple Storage Service et sujet à modification.
Chaque vecteur est constitué d’une clé qui identifie de manière unique chaque vecteur dans un index vectoriel. En outre, vous pouvez attacher des métadonnées (par exemple, année, auteur, genre, lieu) sous forme de paires clé-valeur à chaque vecteur.
Les opérations relatives aux données vectorielles incluent l’insertion, le listage, l’interrogation et la suppression de vecteurs. Pour générer de nouvelles vectorisations de vos données non structurées, vous pouvez utiliser l’opération d’API InvokeModel d’Amazon Bedrock pour spécifier l’ID du modèle de vectorisation que vous souhaitez utiliser. En outre, l’outil open source Amazon S3 Vectors Embed CLI fournit un moyen simplifié de générer des vectorisations et d’effectuer des recherches sémantiques à partir de la ligne de commande. Pour plus d’informations sur cet outil open source qui automatise à la fois la génération de vectorisations avec les modèles de fondation Amazon Bedrock et les opérations de recherche sémantique dans vos index vectoriels S3, consultez Création de vectorisation et réalisation de recherches sémantiques avec s3vectors-embed-cli.
Concepts de vecteur
Clés vectorielles : chaque vecteur est identifié par une clé vectorielle unique dans l’index. Les clés vectorielles peuvent contenir jusqu’à 1 024 caractères et doivent être uniques dans l’index vectoriel. Les clés sont sensibles à la casse et peuvent contenir n’importe quel caractère UTF-8.
Dimension vectorielle : une dimension est le nombre de valeurs d’un vecteur. Les plus grandes dimensions nécessitent plus d’espace de stockage. Tous les vecteurs d’un index doivent avoir le même nombre de dimensions, qui est spécifié lors de la création de l’index. Une dimension doit être un entier compris entre 1 et 4 096.
Métadonnées : vous pouvez associer des métadonnées aux vecteurs sous forme de paires clé-valeur pour fournir un contexte supplémentaire et activer le filtrage lors des requêtes. Les métadonnées incluent des clés de métadonnées filtrables et non filtrables. Les métadonnées filtrables sont utilisées pour le filtrage des requêtes. Les clés de métadonnées non filtrables sont spécifiées lors de la création d’un index vectoriel et fournissent un contexte supplémentaire mais ne peuvent pas être utilisées pour le filtrage. Les métadonnées prennent en charge les types Chaîne, Numérique et Booléen. Pour plus d’informations sur les métadonnées filtrables et non filtrables, consultez Filtrage de métadonnées. Pour plus d’informations sur les limites relatives aux métadonnées, y compris la limite de taille des métadonnées par vecteur et le nombre maximal de clés de métadonnées par vecteur, consultez Limites et restrictions.