Bonnes pratiques relatives à S3 Vectors - Amazon Simple Storage Service

Bonnes pratiques relatives à S3 Vectors

Amazon S3 Vectors fournit un stockage vectoriel spécialement conçu et optimisé en termes de coûts pour vos applications basées sur l’IA et la recherche sémantique du contenu stocké dans Amazon S3. Conçu pour fournir une élasticité et une durabilité de niveau S3 pour le stockage de jeux de données vectorielles avec des performances de requête inférieures à la seconde, S3 Vectors est idéal pour les applications qui doivent créer et développer des index vectoriels. Avec S3 Vectors, vous pouvez utiliser un ensemble dédié d’opérations d’API pour stocker, accéder et exécuter des requêtes de similarité sur des données vectorielles sans fournir d’infrastructure. Pour plus d’informations, consultez Utilisation de S3 Vectors et de compartiments de vecteur.

Pour tirer le meilleur parti de S3 Vectors, nous vous recommandons de suivre les bonnes pratiques suivantes.

Insertion et suppression de vecteurs

Votre application peut réaliser au moins cinq demandes PutVectors et DeleteVectors par seconde et par index vectoriel. Si vous dépassez le taux de demandes, il est possible que vous receviez un message d’erreur 429 TooManyRequestsException. Pour optimiser le débit des demandes et optimiser la vitesse et l’efficacité, nous vous recommandons d’insérer et de supprimer des vecteurs par lots importants, jusqu’à un maximum de 500 vecteurs par demande d’API. Pour plus d’informations, consultez Index vectoriels.

Accès et interrogation de vecteurs dans un index de vecteur S3

Votre application peut réaliser des centaines de demandes QueryVectors, GetVectors ou ListVectors par seconde et par index vectoriel S3. Si vous dépassez le taux de demandes, il est possible que vous receviez un message d’erreur 429 TooManyRequestsException. Nous vous recommandons d’utiliser un mécanisme de nouvelle tentative et de configurer votre application pour qu’elle envoie moins de demandes.

Mise à l’échelle des index de vecteur

Pour améliorer les performances des requêtes par index vectoriel, pensez à configurer votre application pour diviser les vecteurs sur plusieurs index vectoriels lorsque cela est possible. Par exemple, si vous avez des charges de travail multi-locataires et que votre application interroge chaque locataire indépendamment, envisagez de stocker les vecteurs de chaque locataire dans un index vectoriel distinct. Pour plus d’informations, consultez Index vectoriels.

Implémentation de la multi-location avec des index vectoriels distincts

Vous pouvez obtenir la multi-location en organisant vos données vectorielles à l’aide d’un index vectoriel unique pour chaque locataire. Vous pouvez utiliser les stratégies IAM et de compartiment pour restreindre l’accès de chaque locataire uniquement à son index vectoriel désigné. Cette approche permet de préserver l’isolation des données et de simplifier la gestion en éliminant la nécessité de créer des compartiments distincts pour chaque locataire. Pour plus d’informations, consultez Identity and Access Management dans S3 Vectors.

Configuration de champs de métadonnées non filtrables pour les index vectoriels

Lorsque vous créez un index vectoriel, configurez les champs de métadonnées qui ne nécessitent pas de filtrage en tant que clés de métadonnées non filtrables. Par exemple, stockez des fragments de texte pour les vectorisations sous forme de champs de métadonnées non filtrables lorsque vous en avez besoin uniquement à titre de référence. Pour plus d’informations, consultez Métadonnées non filtrables.