Query sui vettori
Nota
Amazon S3 Vectors è disponibile in versione di anteprima per Amazon Simple Storage Service ed è soggetto a modifiche.
È possibile eseguire una query di somiglianza con l’operazione API QueryVectors, in cui si specifica il vettore di query, il numero di risultati pertinenti da restituire (i primi K risultati più simili) e l’ARN dell’indice. Inoltre, si possono utilizzare i filtri di metadati in una query per cercare solo i vettori che corrispondono al filtro. Se si effettua una richiesta di filtro in base a un campo di metadati non filtrabili, la richiesta restituirà un errore 400 Bad
Request. Per ulteriori informazioni sul filtro dei metadati, consulta Filtro dei metadati.
Nella risposta, per impostazione predefinita vengono restituite le chiavi del vettore. Facoltativamente, è possibile includere nella risposta la distanza e i metadati.
Quando si genera il vettore di query, è necessario utilizzare lo stesso modello di embedding vettoriale utilizzato per generare i vettori iniziali archiviati nell’indice vettoriale. Ad esempio, se si utilizza il modello Embedding di testo Amazon Titan V2 in Amazon Bedrock per generare embedding vettoriali dei documenti, è necessario utilizzare lo stesso modello di embedding per convertire una domanda in un vettore di query. Inoltre, Knowledge Base per Amazon Bedrock fornisce un flusso di lavoro RAG end-to-end completamente gestito in cui Amazon Bedrock recupera automaticamente i dati dall’origine dati S3, converte i contenuti in blocchi di testo, genera embedding e li archivia nell’indice vettoriale. È quindi possibile eseguire query sulla knowledge base e ottenere risposte basate sui blocchi recuperati dai dati di origine. Per ulteriori informazioni su come eseguire query sui vettori da una knowledge base per Amazon Bedrock nella console, consulta (Facoltativo) Integrazione di S3 Vectors con Knowledge Base per Amazon Bedrock.
Inoltre, lo strumento open source Amazon S3 Vectors Embed CLI offre un modo semplificato per eseguire ricerche semantiche dalla riga di comando. Questo strumento open source semplifica il processo di query gestendo sia la generazione di embedding vettoriali con i modelli di fondazione di Amazon Bedrock sia l’esecuzione di operazioni di ricerca semantica sugli indici vettoriali S3. Per ulteriori informazioni sull’utilizzo di questo strumento per effettuare query sui dati vettoriali, consulta Creazione di embedding vettoriali ed esecuzione di ricerche semantiche con s3vectors-embed-cli.
S3 Vectors offre tempi di latenza delle query inferiori al secondo. S3 Vectors utilizza il throughput elastico di Amazon S3 per gestire le ricerche su milioni di vettori ed è ideale per i carichi di lavoro in cui le query sono meno frequenti. Per l’esecuzione di query di somiglianza per gli embedding vettoriali, diversi fattori possono influire sulle prestazioni di richiamata medie, tra cui il modello di embedding vettoriale, la dimensione del set di dati vettoriali (il numero di vettori e le dimensioni) e la distribuzione delle query. S3 Vectors offre una richiamata media superiore al 90% per la maggior parte dei set di dati. La richiamata media misura la qualità dei risultati delle query. Una richiamata media del 90% significa che la risposta contiene il 90% dei vettori effettivi più vicini (dati acquisiti) archiviati nell’indice vettoriale relativo al vettore di query. Tuttavia, poiché le prestazioni effettive possono variare a seconda dei casi d’uso specifici, è consigliabile eseguire test personalizzati con dati e query rappresentativi per verificare che S3 Vectors soddisfi i requisiti di richiamata.