Prerequisiti Come funziona Prezzi dell'accelerazione GPU Accelerazione tramite GPU e operazioni di scrittura Configurazioni degli indici supportate Best practice

Accelerazione GPU per l'indicizzazione vettoriale

L'accelerazione GPU consente di creare database vettoriali su larga scala in modo più rapido ed efficiente. Puoi abilitare questa funzionalità su domini e raccolte Serverless nuovi o esistenti. OpenSearch OpenSearch Questa funzionalità utilizza l'accelerazione GPU per ridurre il tempo necessario per indicizzare i dati in indici vettoriali.

Con l'accelerazione GPU, puoi aumentare la velocità di indicizzazione vettoriale fino a 10 volte a un quarto del costo di indicizzazione.

Prerequisiti

L'accelerazione GPU è supportata nei domini che eseguono una versione o successiva e nelle raccolte Serverless. OpenSearch OpenSearch 3.1 OpenSearch Per ulteriori informazioni, vedere, e. Aggiornamento dei domini Amazon Service OpenSearch UpdateDomainConfig UpdateCollection APIs

Come funziona

Gli indici vettoriali richiedono risorse di calcolo significative per creare strutture di dati come i grafici Hierarchical Navigable Small Worlds (HNSW). Quando abiliti l'accelerazione GPU sul tuo dominio o sulla tua raccolta, rileva OpenSearch automaticamente le opportunità per accelerare la creazione dell'indice e trasferisce le build dell'indice su istanze GPU. OpenSearch Il servizio gestisce le istanze GPU per tuo conto, assegnandole al tuo dominio o alla tua raccolta quando necessario. Ciò significa che non gestisci l'utilizzo né paghi per i tempi di inattività.

Paghi solo per l'elaborazione utile tramite Compute Units (OCU) - Vector Acceleration. Ogni OCU di accelerazione vettoriale è una combinazione di circa 8 GiB di memoria CPU, 2 v CPUs e 6 GiB di memoria GPU. Per ulteriori informazioni, consulta Prezzi dell'accelerazione GPU.

Per abilitare l'accelerazione GPU per il tuo dominio o la tua raccolta, consulta. Abilitazione dell'accelerazione tramite GPU

Prezzi dell'accelerazione GPU

AWS ti addebita quando OpenSearch rileva opportunità per accelerare i carichi di lavoro di creazione dell'indice del tuo dominio o della tua raccolta. Ogni OCU di accelerazione vettoriale è una combinazione di circa 8 GiB di memoria CPU, 2 v CPUs e 6 GiB di memoria GPU.

AWS fattura l'OCU con granularità di secondo livello. Nel tuo estratto conto, vedrai una voce relativa al calcolo in OCU-Hours.

Ad esempio, quando utilizzi l'accelerazione GPU per un'ora per creare un indice, utilizzando 2 vCPU e 1 GiB di memoria GPU, ti viene fatturato 1 OCU. Se utilizzi 9 GiB di memoria CPU mentre utilizzi l'accelerazione GPU, ti verranno fatturati 2 OCU.

OpenSearch Serverless ne aggiunge altre OCUs in incrementi di 1 OCU in base alla potenza di elaborazione e allo storage necessari per supportare le tue raccolte. Puoi configurare un numero massimo di OCUs per il tuo account per controllare i costi.

Nota

Il numero di OCUs unità fornite in qualsiasi momento può variare e non è esatto. Nel tempo, l'algoritmo utilizzato da OpenSearch Serverless continuerà a migliorare per ridurre al minimo l'utilizzo del sistema. OpenSearch

Per i dettagli completi sui prezzi, consulta la pagina dei prezzi OpenSearch di Amazon Service.

Accelerazione tramite GPU e operazioni di scrittura

L'accelerazione GPU viene attivata quando la velocità di ingestione vettoriale ( OpenSearchMB/sec) rientra in un intervallo. Sui OpenSearch domini, hai la flessibilità di configurare questo intervallo tramite e. index.knn.remote_index_build.size.min index.knn.remote_index_build.size.max Ad esempio, con l'intervallo inferiore predefinito di 50 MB, la scrittura di 15.000 vettori a piena precisione con una dimensione di 768 tra gli intervalli di aggiornamento attiverà l'accelerazione GPU per impostazione predefinita.

I dati vengono scritti con le seguenti operazioni API:

L'accelerazione GPU viene attivata con l'unione automatica e manuale dei segmenti.

Configurazioni degli indici supportate

Il motore Faiss supporta l'accelerazione GPU.

Le seguenti configurazioni non supportano l'accelerazione GPU:

Best practice

Segui queste best practice per massimizzare i vantaggi dell'accelerazione GPU per i tuoi carichi di lavoro di ricerca vettoriale:

Aumenta i client di indicizzazione: per sfruttare appieno i vantaggi della creazione dell' GPUs indice, aumenta il numero di client di indicizzazione in cui vengono importati i dati. OpenSearch Ciò consente una migliore parallelizzazione e utilizzo delle risorse GPU.
Regola la soglia approssimativa: modifica l'index.knn.advanced.approximate_thresholdimpostazione per garantire che non si verifichino aumenti di indici di segmenti più piccoli, il che migliora la velocità complessiva di inserimento. Un valore di 10.000 è un buon punto di partenza. Per le raccolte, è necessario specificare esplicitamente un valore per questa impostazione.
Ottimizza le dimensioni dei frammenti: prova a creare frammenti contenenti almeno 1 milione di documenti. Gli shard con un numero di documenti inferiore a questo numero potrebbero non trarre benefici complessivi dall'accelerazione tramite GPU.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Utilizzo dell'ottimizzazione automatica nella console

Abilita l'accelerazione GPU