Prácticas recomendadas de S3 Vectors
Amazon S3 Vectors ofrece almacenamiento vectorial optimizado para el costo y personalizado a fin de usarlo en aplicaciones habilitadas para IA y la búsqueda semántica del contenido almacenado en Amazon S3. Se ha diseñado para proporcionar elasticidad y durabilidad de tipo S3 a fin de almacenar conjuntos de datos vectoriales con un rendimiento de consultas inferior a un segundo para consultas en frío y tan bajo como 100 milisegundos para consultas en caliente, los vectores de S3 son ideales para aplicaciones que necesitan crear y ampliar índices vectoriales. Con S3 Vectors, puede utilizar un conjunto dedicado de operaciones de la API para almacenar y realizar consultas de similitud en datos vectoriales, así como acceder a ellas, sin aprovisionar ninguna infraestructura. Para obtener más información, consulte Uso de S3 Vectors y buckets vectoriales.
Se recomienda realizar las siguientes prácticas recomendadas si desea aprovechar al máximo los beneficios de S3 Vectors.
- Inserción y eliminación de vectores
-
La aplicación puede recibir hasta mil solicitudes PutVectors o DeleteVectors por segundo por índice vectorial o puede insertar o eliminar hasta dos mil quinientos vectores por segundo por índice vectorial, el límite que se alcance primero. Si supera las tasas de solicitudes, es posible que reciba un error
429 TooManyRequestsException.Para optimizar los costos, recomendamos insertar y eliminar vectores en lotes grandes, hasta un tamaño máximo de lote de 500 vectores por solicitud de la API. Si la carga de trabajo requiere lotes más pequeños, puede enviar solicitudes simultáneas hasta el límite de 1000 solicitudes por segundo. Para alcanzar un rendimiento máximo de 2500 vectores por segundo, puede enviar 5 lotes por segundo con 500 vectores cada uno o 1000 lotes por segundo con una media de 2,5 vectores cada uno.
- Acceso y consulta de vectores en un índice vectorial de S3
-
La aplicación puede alcanzar cientos de solicitudes QueryVectors, GetVectors o ListVectors por segundo por cada índice vectorial de S3. Si supera las tasas de solicitudes, es posible que reciba un error
429 TooManyRequestsException. Le recomendamos que utilice un mecanismo de reintentos y configure la aplicación para enviar menos solicitudes. - Escalado entre índices vectoriales
-
Para mejorar el rendimiento de las consultas por índice vectorial, considere la posibilidad de configurar la aplicación para dividir los vectores entre varios índices vectoriales cuando sea posible. Por ejemplo, si tiene cargas de trabajo de varios inquilinos y la aplicación consulta cada inquilino de forma independiente, considere la posibilidad de almacenar los vectores de cada inquilino en un índice vectorial aparte. Para obtener más información, consulte Índices vectoriales.
- Implementación de la multitenencia con índices vectoriales independientes
-
Puede alcanzar la multitenencia si organiza los datos vectoriales mediante un único índice vectorial para cada inquilino. Puede utilizar políticas de IAM y de bucket para restringir el acceso de cada inquilino solo al índice vectorial designado. Este enfoque ayuda a mantener el aislamiento de los datos y simplifica la administración al eliminar la necesidad de crear buckets separados para cada inquilino. Para obtener más información, consulte Administración de identidades y accesos en S3 Vectors.
- Configuración de campos de metadatos no filtrables para índices vectoriales
-
Al crear un índice vectorial, configure los campos de metadatos que no requieran filtrado como claves de metadatos no filtrables. Por ejemplo, almacene fragmentos de texto para incrustaciones vectoriales como campos de metadatos no filtrables cuando solo los necesite como referencia. Para obtener más información, consulte Metadatos no filtrables.