Registra la tua connessione come Catalogo Dati Glue - Amazon Athena

Registra la tua connessione come Catalogo Dati Glue

Dopo aver creato l'origine dati, è possibile utilizzare la console Athena per registrare la tua connessione come Catalogo Dati Glue. Una volta registrato, è possibile gestire il catalogo di dati federato e abilitare il controllo granulare degli accessi utilizzando Lake Formation. Per ulteriori informazioni, consultare Creazione di un catalogo federato.

È possibile registrare i seguenti connettori da integrare con AWS Glue per il controllo granulare degli accessi.

  • Redshift

  • BigQuery

  • DynamoDB (anteprima)

  • Snowflake (anteprima)

  • MySQL

  • PostgreSQL

  • AWS CMDB

  • Timestream

  • Archiviazione Azure Data Lake

  • Azure Synapse

  • IBM Db2

  • IBM Db2 AS/400 (Db2 iSeries)

  • DocumentDB

  • Google Cloud Storage

  • HBase

  • OpenSearch

  • Oracle

  • SAP HANA

  • SQL Server

  • TPC-DS

  • Cloudera Hive

  • Cloudwatch

  • Parametri Cloudwatch

  • Teradata

  • Vertica

Prerequisiti

Prima di iniziare, è necessario completare i seguenti prerequisiti.

  • Assicurati di disporre dei ruoli e delle autorizzazioni richieste per registrare le sedi. Per ulteriori informazioni, consultare Requisiti per ruoli nella Guida per gli sviluppatori AWS Lake Formation.

  • Assicurarsi di disporre dei ruoli richiesti in Lake Formation. Per ulteriori informazioni, consultare la sezione Prerequisiti per la connessione del catalogo dati a origini dati esterne nella Guida per sviluppatori AWS Lake Formation.

  • Il ruolo registrato in Glue deve disporre delle autorizzazioni elencate nell'esempio seguente.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix/*", "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "arn:aws:lambda:us-east-1:111122223333:function:lambda_function_name" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:us-east-1:111122223333:connection/<connection_name>", "arn:aws:glue:us-east-1:111122223333:catalog" ] } ] }
  • L'utente è responsabile di determinare e gestire un accesso appropriato ai dati. Con controlli di accesso dettagliati sulle query federate, si consiglia di utilizzare la policy gestita AmazonAthenaFullAccess. Se si desidera utilizzare una policy personalizzata, assicurarsi che gli utenti che eseguono le query federate non abbiano accesso alle seguenti risorse.

    • lambda:InvokeFunction sul connettore Lambda specificato nella connessione Glue

    • Accesso alla posizione del bucket spill in IAM

    • Accesso alla connessione Glue associata al proprio catalogo federato

    • Il ruolo di Lake Formation in IAM

Registrare la propria connessione utilizzando la console

Per registrare la propria connessione come Catalogo Dati Glue
  1. Aprire la console Athena all'indirizzo https://console.aws.amazon.com/athena/.

  2. Nel pannello di navigazione scegliere Origini dati e cataloghi.

  3. Dall'elenco Origini dati, scegliere l'origine dati creata per aprire la pagina Dettagli dell'origine dati.

  4. Selezionare Nozioni di base su AWS Lake Formation.

    Nota

    Dopo aver scelto questa opzione, bisogna gestire la funzione Lambda in proprio. Athena non eliminerà la funzione Lambda.

  5. Per Nome catalogo dati, fornire un nome univoco per il proprio catalogo.

  6. Scegliere il ruolo IAM di Lake Formation che concede il permesso a Lake Formation di invocare la funzione Lambda. Assicurarsi che il ruolo disponga delle autorizzazioni mostrate nell'esempio.

  7. Nella casella di testo, digitare conferma per eliminare l'origine dati Athena, sostituirla con una registrazione del catalogo dati Glue.

    Nota

    Questa azione eliminerà l’origine dati Athena e creerà un nuovo catalogo dati Glue al suo posto. Una volta completata questa procedura, potrebbe essere necessario aggiornare le query che accedono all'origine dati per fare invece riferimento al catalogo dati Glue appena creato.

  8. Scegliere Crea catalogo e vai a Lake Formation. Si apre la console Lake Formation in cui è possibile gestire il catalogo e concedere le autorizzazioni agli utenti su cataloghi, database e tabelle.