Best practice per S3 Vectors
Amazon S3 Vectors offre un’archiviazione vettoriale personalizzata e ottimizzata in termini di costi per le applicazioni abilitate per l’intelligenza artificiale e la ricerca semantica dei contenuti archiviati in Amazon S3. Progettato per fornire l’elasticità e la durabilità di livello S3 per l’archiviazione di set di dati vettoriali con prestazioni di query inferiori al secondo, S3 Vectors è ideale per le applicazioni che necessitano di creare e ampliare indici vettoriali. Con S3 Vectors è possibile utilizzare un set dedicato di operazioni API per archiviare, accedere ed eseguire query di somiglianza su dati vettoriali senza dover allocare alcuna infrastruttura. Per ulteriori informazioni, consulta Utilizzo di S3 Vectors e bucket vettoriali.
Per ottenere il massimo vantaggio da S3 Vectors, è consigliabile eseguire le best practice riportate di seguito.
- Inserimento ed eliminazione di vettori
-
L’applicazione può inviare almeno cinque richieste PutVectors e DeleteVectors al secondo per indice vettoriale. Se si supera la frequenza di richiesta, potrebbe essere generato un errore
429 TooManyRequestsException. Per massimizzare il throughput delle richieste e ottimizzarne la velocità e l’efficienza, è consigliabile inserire ed eliminare i vettori in batch di grandi dimensioni, fino a un massimo di 500 vettori per richiesta API. Per ulteriori informazioni, consulta Indici vettoriali. - Accesso e query sui vettori in un indice vettoriale S3
-
L’applicazione può inviare centinaia di richieste QueryVectors, GetVectors o ListVectors al secondo per indice vettoriale S3. Se si supera la frequenza di richiesta, potrebbe essere generato un errore
429 TooManyRequestsException. È consigliabile utilizzare un meccanismo di tentativi e di configurare l’applicazione per inviare meno richieste. - Dimensionamento tra indici vettoriali
-
Per migliorare le prestazioni delle query per indice vettoriale, si può considerare la possibilità di configurare l’applicazione in modo da dividere i vettori tra più indici vettoriali, ove possibile. Ad esempio, se sono presenti carichi di lavoro multi-tenant e l’applicazione esegue query su ciascun tenant in modo indipendente, è possibile archiviare i vettori di ciascun tenant in un indice vettoriale separato. Per ulteriori informazioni, consulta Indici vettoriali.
- Implementazione della multi-tenancy con indici vettoriali separati
-
È possibile ottenere la multi-tenancy organizzando i dati vettoriali con un unico indice vettoriale per ogni tenant. È possibile utilizzare le policy di bucket e IAM per limitare l’accesso di ogni tenant al solo indice vettoriale designato. Questo approccio aiuta a mantenere l’isolamento dei dati e semplifica la gestione eliminando la necessità di creare bucket separati per ogni tenant. Per ulteriori informazioni, consulta Identity and Access Management in S3 Vectors.
- Configurazione di campi di metadati non filtrabili per indici vettoriali
-
Quando si crea un indice vettoriale, i campi di metadati che non richiedono il filtro si configurano come chiavi di metadati non filtrabili. Ad esempio, è possibile archiviare i blocchi di testo per gli embedding vettoriali come campi di metadati non filtrabili se sono necessari solo come riferimento. Per ulteriori informazioni, consulta Metadati non filtrabili.