Best practice per S3 Vectors

Amazon S3 Vectors offre un’archiviazione vettoriale personalizzata e ottimizzata in termini di costi per le applicazioni abilitate per l’intelligenza artificiale e la ricerca semantica dei contenuti archiviati in Amazon S3. Progettato per fornire elasticità e durata a livello S3 per l'archiviazione di set di dati vettoriali con prestazioni di query inferiori al secondo per le query fredde e fino a 100 millisecondi per le query calde, S3 Vectors è ideale per le applicazioni che devono creare e far crescere indici vettoriali. Con S3 Vectors è possibile utilizzare un set dedicato di operazioni API per archiviare, accedere ed eseguire query di somiglianza su dati vettoriali senza dover allocare alcuna infrastruttura. Per ulteriori informazioni, consulta Utilizzo di S3 Vectors e bucket vettoriali.

Per ottenere il massimo vantaggio da S3 Vectors, è consigliabile eseguire le best practice riportate di seguito.

Inserimento ed eliminazione di vettori

L'applicazione può ottenere fino a mille PutVectors DeleteVectorsrichieste al secondo per indice vettoriale oppure può inserire o eliminare fino a duemilacinquecento vettori al secondo per indice vettoriale, a seconda del limite raggiunto per primo. Se si supera la frequenza di richiesta, potrebbe essere generato un errore 429 TooManyRequestsException.

Per ottimizzare i costi, consigliamo di inserire ed eliminare i vettori in batch di grandi dimensioni, fino alla dimensione massima del batch di 500 vettori per richiesta API. Se il carico di lavoro richiede batch più piccoli, puoi inviare richieste simultanee fino al limite di 1.000 richieste al secondo. Per raggiungere la velocità massima di 2.500 vettori al secondo, puoi inviare 5 batch al secondo con 500 vettori ciascuno o 1.000 batch al secondo con una media di 2,5 vettori ciascuno.

Accesso e query sui vettori in un indice vettoriale S3

La tua applicazione può raggiungere centinaia di ListVectorsrichieste al secondo per QueryVectorsindice GetVectorsvettoriale S3. Se si supera la frequenza di richiesta, potrebbe essere generato un errore 429 TooManyRequestsException. È consigliabile utilizzare un meccanismo di tentativi e di configurare l’applicazione per inviare meno richieste.

Dimensionamento tra indici vettoriali

Per migliorare le prestazioni delle query per indice vettoriale, si può considerare la possibilità di configurare l’applicazione in modo da dividere i vettori tra più indici vettoriali, ove possibile. Ad esempio, se sono presenti carichi di lavoro multi-tenant e l’applicazione esegue query su ciascun tenant in modo indipendente, è possibile archiviare i vettori di ciascun tenant in un indice vettoriale separato. Per ulteriori informazioni, consulta Indici vettoriali.

Implementazione della multi-tenancy con indici vettoriali separati

È possibile ottenere la multi-tenancy organizzando i dati vettoriali con un unico indice vettoriale per ogni tenant. È possibile utilizzare le policy di bucket e IAM per limitare l’accesso di ogni tenant al solo indice vettoriale designato. Questo approccio aiuta a mantenere l’isolamento dei dati e semplifica la gestione eliminando la necessità di creare bucket separati per ogni tenant. Per ulteriori informazioni, consulta Identity and Access Management in S3 Vectors.

Configurazione di campi di metadati non filtrabili per indici vettoriali

Quando si crea un indice vettoriale, i campi di metadati che non richiedono il filtro si configurano come chiavi di metadati non filtrabili. Ad esempio, è possibile archiviare i blocchi di testo per gli embedding vettoriali come campi di metadati non filtrabili se sono necessari solo come riferimento. Per ulteriori informazioni, consulta Metadati non filtrabili.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Limitazioni e restrizioni

Creazione e ricerca di embedding vettoriali con s3vectors-embed-cli