Registrare i cataloghi di dati Redshift in Athena
Athena è in grado di leggere e scrivere dati archiviati in cluster Redshift o namespace serverless registrati in AWS Glue Data Catalog. Ciò funziona in tandem con AWS Lake Formation, che fornisce sicurezza e governance centralizzate, garantendo che l'accesso ai dati sia gestito in modo coerente su diversi motori di query e mantenendo controlli di accesso granulari per i dati Redshift condivisi.
Considerazioni e limitazioni
-
Viste materializzate: le viste materializzate di Amazon Redshift possono essere interrogate da Athena, ma la creazione di viste materializzate utilizzando Athena o Spark non è supportata.
-
Le operazioni DDL, inclusa l'impostazione della configurazione AWS Glue Data Catalog e le operazioni sulle tabelle di storage gestite da Amazon Redshift, non sono supportate.
Prerequisiti
Prima di eseguire una query su un catalogo dati AWS Glue da Athena, completare le seguenti attività:
-
Creare e registrare un cluster Amazon Redshift o un namespace serverless su AWS Glue Data Catalog. Per ulteriori informazioni, consultare Registrazione di un cluster su AWS Glue Data Catalog o Registrazione dei namespace su AWS Glue Data Catalog nella Guida alla gestione di Amazon Redshift.
-
Creare un catalogo dati in AWS Lake Formation dal namespace registrato. Per maggiori informazioni, consultare Creazione di cataloghi federati Amazon Redshift nella Guida per gli sviluppatori AWS Lake Formation.
-
(Facoltativo) Utilizzare Lake Formation per impostare controlli di accesso dettagliati sul catalogo. Per ulteriori informazioni, consultare Trasferimento di dati in AWS Glue Data Catalog nella Guida per gli sviluppatori AWS Lake Formation.
Registrare un catalogo dati Redshift con la console Athena
Per registrare un catalogo dati Redshift con la console Athena, procedere come segue.
-
Aprire la console Athena all'indirizzo https://console.aws.amazon.com/athena/
. -
Nel pannello di navigazione, scegliere Origini dati e cataloghi.
-
Nella pagina Origini dati e cataloghi, scegliere Crea origine dati.
-
Per Scegli un'origine dati, scegliere Amazon S3 - AWS Glue Data Catalog.
-
Nella sezione AWS Glue Data Catalog, per Account di origine dati, scegliere AWS Glue Data Catalogin questo account.
-
Per Creare una tabella o registrare un catalogo, scegliere Registra un nuovo catalogo AWS Glue.
-
Nella sezione Dettagli origine dati, per Nome origine dati, inserire il nome che si desidera utilizzare per specificare l'origine dati nelle query SQL o utilizzare il nome predefinito che viene generato.
-
Per Catalogo, scegliere Sfoglia per cercare un elenco di cataloghi AWS Glue nello stesso account. Se non si vede alcun catalogo esistente, crearne uno nella console AWS Glue
. -
Nella finestra di dialogo Sfoglia cataloghi AWS Glue, selezionare il catalogo che si desidera utilizzare, quindi selezionare Scegli.
-
(Facoltativo) Per Tag, inserire le coppie chiave/valore da associare all'origine dati.
-
Scegli Successivo.
-
Nella pagina Rivedi e crea, esaminare le informazioni inserite, quindi scegliere Crea origine dei dati.