Bonnes pratiques relatives à S3 Vectors

Amazon S3 Vectors fournit un stockage vectoriel spécialement conçu et optimisé en termes de coûts pour vos applications basées sur l’IA et la recherche sémantique du contenu stocké dans Amazon S3. Conçu pour fournir une élasticité et une durabilité de niveau S3 pour le stockage d'ensembles de données vectorielles, avec des performances de requête inférieures à une seconde pour les requêtes froides et aussi peu que 100 millisecondes pour les requêtes chaudes, S3 Vectors est idéal pour les applications qui ont besoin de créer et de développer des index vectoriels. Avec S3 Vectors, vous pouvez utiliser un ensemble dédié d’opérations d’API pour stocker, accéder et exécuter des requêtes de similarité sur des données vectorielles sans fournir d’infrastructure. Pour de plus amples informations, veuillez consulter Utilisation de S3 Vectors et de compartiments de vecteur.

Pour tirer le meilleur parti de S3 Vectors, nous vous recommandons de suivre les bonnes pratiques suivantes.

Insertion et suppression de vecteurs

Votre application peut traiter jusqu'à mille PutVectors DeleteVectorsrequêtes par seconde par index vectoriel, ou peut insérer ou supprimer jusqu'à deux mille cinq cents vecteurs par seconde et par indice vectoriel, selon la première limite atteinte. Si vous dépassez le taux de demandes, il est possible que vous receviez un message d’erreur 429 TooManyRequestsException.

Pour optimiser les coûts, nous recommandons d'insérer et de supprimer des vecteurs par lots volumineux, jusqu'à une taille de lot maximale de 500 vecteurs par demande d'API. Si votre charge de travail nécessite des lots plus petits, vous pouvez envoyer des demandes simultanées jusqu'à la limite de 1 000 demandes par seconde. Pour atteindre un débit maximal de 2 500 vecteurs par seconde, vous pouvez envoyer 5 lots par seconde de 500 vecteurs chacun, ou 1 000 lots par seconde avec une moyenne de 2,5 vecteurs chacun.

Accès et interrogation de vecteurs dans un index de vecteur S3

Votre application peut traiter des centaines de QueryVectors ListVectorsrequêtes par seconde par index vectoriel S3. GetVectors Si vous dépassez le taux de demandes, il est possible que vous receviez un message d’erreur 429 TooManyRequestsException. Nous vous recommandons d’utiliser un mécanisme de nouvelle tentative et de configurer votre application pour qu’elle envoie moins de demandes.

Mise à l’échelle des index de vecteur

Pour améliorer les performances des requêtes par index vectoriel, pensez à configurer votre application pour diviser les vecteurs sur plusieurs index vectoriels lorsque cela est possible. Par exemple, si vous avez des charges de travail multi-locataires et que votre application interroge chaque locataire indépendamment, envisagez de stocker les vecteurs de chaque locataire dans un index vectoriel distinct. Pour de plus amples informations, veuillez consulter Index vectoriels.

Implémentation de la multi-location avec des index vectoriels distincts

Vous pouvez obtenir la multi-location en organisant vos données vectorielles à l’aide d’un index vectoriel unique pour chaque locataire. Vous pouvez utiliser les stratégies IAM et de compartiment pour restreindre l’accès de chaque locataire uniquement à son index vectoriel désigné. Cette approche permet de préserver l’isolation des données et de simplifier la gestion en éliminant la nécessité de créer des compartiments distincts pour chaque locataire. Pour de plus amples informations, veuillez consulter Identity and Access Management dans S3 Vectors.

Configuration de champs de métadonnées non filtrables pour les index vectoriels

Lorsque vous créez un index vectoriel, configurez les champs de métadonnées qui ne nécessitent pas de filtrage en tant que clés de métadonnées non filtrables. Par exemple, stockez des fragments de texte pour les vectorisations sous forme de champs de métadonnées non filtrables lorsque vous en avez besoin uniquement à titre de référence. Pour de plus amples informations, veuillez consulter Métadonnées non filtrables.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Limites et restrictions

Création et recherche de vectorisations avec s3vectors-embed-cli