Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Accelerazione GPU per l'indicizzazione vettoriale
L'accelerazione GPU consente di creare database vettoriali su larga scala in modo più rapido ed efficiente. Puoi abilitare questa funzionalità su domini e raccolte Serverless nuovi o esistenti. OpenSearch OpenSearch Questa funzionalità utilizza l'accelerazione GPU per ridurre il tempo necessario per indicizzare i dati in indici vettoriali.
Con l'accelerazione GPU, puoi aumentare la velocità di indicizzazione vettoriale fino a 10 volte a un quarto del costo di indicizzazione.
Prerequisiti
L'accelerazione GPU è supportata nei domini che eseguono una versione o successiva e nelle raccolte Serverless. OpenSearch OpenSearch 3.1 OpenSearch Per ulteriori informazioni, vedere, e. Aggiornamento dei domini Amazon Service OpenSearch UpdateDomainConfigUpdateCollection APIs
Come funziona
Gli indici vettoriali richiedono risorse di calcolo significative per creare strutture di dati come i grafici Hierarchical Navigable Small Worlds (HNSW). Quando abiliti l'accelerazione GPU sul tuo dominio o sulla tua raccolta, rileva OpenSearch automaticamente le opportunità per accelerare la creazione dell'indice e trasferisce le build dell'indice su istanze GPU. OpenSearch Il servizio gestisce le istanze GPU per tuo conto, assegnandole al tuo dominio o alla tua raccolta quando necessario. Ciò significa che non gestisci l'utilizzo né paghi per i tempi di inattività.
Paghi solo per l'elaborazione utile tramite Compute Units (OCU) - Vector Acceleration. Ogni OCU di accelerazione vettoriale è una combinazione di circa 8 GiB di memoria CPU, 2 v CPUs e 6 GiB di memoria GPU. Per ulteriori informazioni, consulta Prezzi dell'accelerazione GPU.
Per abilitare l'accelerazione GPU per il tuo dominio o la tua raccolta, consulta. Abilitazione dell'accelerazione tramite GPU
Prezzi dell'accelerazione GPU
AWSti addebita quando OpenSearch rileva opportunità per accelerare i carichi di lavoro di creazione dell'indice del tuo dominio o della tua raccolta. Ogni OCU di accelerazione vettoriale è una combinazione di circa 8 GiB di memoria CPU, 2 v CPUs e 6 GiB di memoria GPU.
AWSfattura l'OCU con granularità di secondo livello. Nel tuo estratto conto, vedrai una voce relativa al calcolo in OCU-Hours.
Ad esempio, quando utilizzi l'accelerazione GPU per un'ora per creare un indice, utilizzando 2 vCPU e 1 GiB di memoria GPU, ti viene fatturato 1 OCU. Se utilizzi 9 GiB di memoria CPU mentre utilizzi l'accelerazione GPU, ti verranno fatturati 2 OCU.
OpenSearch Serverless ne aggiunge altre OCUs in incrementi di 1 OCU in base alla potenza di elaborazione e allo storage necessari per supportare le tue raccolte. Puoi configurare un numero massimo di OCUs per il tuo account per controllare i costi.
Nota
Il numero di OCUs unità fornite in qualsiasi momento può variare e non è esatto. Nel tempo, l'algoritmo utilizzato da OpenSearch Serverless continuerà a migliorare per ridurre al minimo l'utilizzo del sistema. OpenSearch
Per i dettagli completi sui prezzi, consulta la pagina dei prezzi OpenSearch di Amazon Service
Accelerazione tramite GPU e operazioni di scrittura
L'accelerazione GPU viene attivata quando la velocità di ingestione vettoriale ( OpenSearchMB/sec) rientra in un intervallo. Sui OpenSearch domini, hai la flessibilità di configurare questo intervallo tramite e.index.knn.remote_index_build.size.min index.knn.remote_index_build.size.max Ad esempio, con l'intervallo inferiore predefinito di 50 MB, la scrittura di 15.000 vettori a piena precisione con una dimensione di 768 tra gli intervalli di aggiornamento attiverà l'accelerazione GPU per impostazione predefinita.
I dati vengono scritti con le seguenti operazioni API:
L'accelerazione GPU viene attivata con l'unione automatica e manuale dei segmenti.
Configurazioni degli indici supportate
Il motore Faiss
Le seguenti configurazioni non supportano l'accelerazione GPU:
Best practice
Segui queste best practice per massimizzare i vantaggi dell'accelerazione GPU per i tuoi carichi di lavoro di ricerca vettoriale:
-
Aumenta i client di indicizzazione: per sfruttare appieno i vantaggi della creazione dell' GPUs indice, aumenta il numero di client di indicizzazione in cui vengono importati i dati. OpenSearch Ciò consente una migliore parallelizzazione e utilizzo delle risorse GPU.
-
Regola la soglia approssimativa: modifica l'
index.knn.advanced.approximate_thresholdimpostazione per garantire che non si verifichino aumenti di indici di segmenti più piccoli, il che migliora la velocità complessiva di inserimento. Un valore di 10.000 è un buon punto di partenza. Per le raccolte, è necessario specificare esplicitamente un valore per questa impostazione. -
Ottimizza le dimensioni dei frammenti: prova a creare frammenti contenenti almeno 1 milione di documenti. Gli shard con un numero di documenti inferiore a questo numero potrebbero non trarre benefici complessivi dall'accelerazione tramite GPU.