Quando utilizzare la replica di S3 Tables Funzionalità

Replica delle tabelle S3

Le tabelle Amazon S3 supportano la replica automatica delle tabelle Apache Iceberg archiviate nei bucket di tabelle Amazon S3. Le destinazioni di replica possono trovarsi all'interno della stessa AWS regione, tra più AWS regioni, sullo stesso account o verso altri account. AWS Configurando la replica per le tabelle, è possibile mantenere repliche di sola lettura dei dati in più posizioni. È possibile utilizzare le repliche per migliorare la disponibilità dei dati, soddisfare i requisiti di conformità e aumentare le prestazioni di accesso per le applicazioni distribuite.

La replica di S3 Tables mantiene la coerenza dei dati eseguendo il commit di tutti gli aggiornamenti delle tabelle, inclusi istantanee, metadati e file di dati, nella tabella di destinazione nello stesso ordine della tabella di origine.

Quando utilizzare la replica di S3 Tables

È possibile utilizzare la replica di S3 Tables per i seguenti scopi:

Ridurre al minimo la latenza: se i clienti si trovano in due aree geografiche, è possibile ridurre al minimo la latenza nell'accesso alle tabelle mantenendo le repliche di lettura nelle AWS regioni geograficamente più vicine agli utenti.
Conformità alle normative: puoi mantenere le repliche di lettura in aree geografiche o AWS account specifici, il che potrebbe aiutarti a soddisfare determinati requisiti normativi o di conformità. È possibile configurare il bucket della tabella di destinazione della replica per crittografare le tabelle con chiavi AWS KMS diverse da quelle di origine.
Analisi centralizzata: se disponi di dati distribuiti in più AWS regioni, puoi replicare i Region-specific set di dati in una regione centralizzata per la creazione di report unificati, l'analisi interregionale e l'addestramento dei modelli di machine learning. Ciò elimina la necessità di eseguire query tra regioni o creare pipeline di aggregazione di dati personalizzate.
Ambienti di test e sviluppo: puoi creare repliche di lettura delle tabelle di produzione in bucket separati Account AWS o in tabelle per fornire dati di test realistici per i team di sviluppo e controllo qualità. Ciò isola i carichi di lavoro di test dai sistemi di produzione, garantendo al contempo che gli ambienti di test dispongano di dati aggiornati e simili alla produzione senza esportazioni manuali o processi di sincronizzazione dei dati.

Funzionalità

La replica di S3 Tables offre le seguenti funzionalità.

Read-only repliche per S3 Tables

La replica di S3 Tables crea repliche in sola lettura delle tabelle Apache Iceberg su diversi bucket di tabelle. Puoi interrogare le repliche in modo indipendente utilizzando qualsiasi motore. Iceberg-compatible

Repliche gestite automaticamente

Il servizio di replica S3 Tables gestisce automaticamente le tabelle di replica. La replica in genere aggiorna le repliche entro pochi minuti dall'aggiornamento all'origine. S3 Tables esegue il commit di tutti gli aggiornamenti nello stesso ordine della tabella di origine per mantenere la coerenza.

Replica su più destinazioni

È possibile replicare la stessa tabella in più bucket di tabelle di destinazione. Le destinazioni di replica possono trovarsi all'interno dello stesso account Regione AWS, tra più account Regioni AWS, nello stesso AWS account o in altri account. AWS

Conservazione indipendente delle istantanee

La scadenza delle istantanee per le tabelle di replica è indipendente dalla tabella di origine e consente di impostare periodi di conservazione diversi sulle tabelle di replica, se necessario. Ad esempio, è possibile configurare la tabella di origine per conservare le istantanee per 30 giorni impostando al contempo un periodo di conservazione di 90 giorni per le tabelle di replica. Se si configura un periodo di conservazione più lungo sulle repliche, le istantanee che scadono all'origine rimangono disponibili e interrogabili nelle repliche. Questa configurazione offre funzionalità di viaggio temporale estese per l'analisi storica.

Conserva le tabelle di replica su livelli di storage a basso costo

È possibile configurare i bucket di tabelle di destinazione per utilizzare la classe di storage S3, che ottimizza automaticamente i costi di Intelligent-Tiering storage in base ai modelli di accesso senza impatto sulle prestazioni o sovraccarico operativo. S3 Intelligent-Tiering è ideale per tabelle di replica a cui è possibile accedere meno frequentemente.

Per ulteriori informazioni sulla replica delle tabelle S3, consulta i seguenti argomenti.

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Lavorare con Apache Iceberg V3

Come funziona la replica di S3 Tables