Integrazione con altri servizi AWS - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Integrazione con altri servizi AWS

Sebbene sia possibile utilizzare Crawler di AWS Glue s per compilarli AWS Glue Data Catalog, esistono diversi AWS servizi che possono integrarsi e popolare automaticamente nel catalogo. Le sezioni seguenti forniscono ulteriori informazioni sui casi d'uso specifici supportati dai AWS servizi che possono popolare il Data Catalog.

AWS Lake Formation

AWS Lake Formation è un servizio che semplifica la configurazione di un data lake sicuro. AWS Lake Formation è costruita su AWS Glue, e Lake Formation AWS Glue condividiamo la stessa cosa AWS Glue Data Catalog. Puoi registrare la tua posizione dati Amazon S3 con Lake Formation e utilizzare la console Lake Formation per creare database e tabelle nel AWS Glue Data Catalog, definire politiche di accesso ai dati e controllare l'accesso ai dati attraverso il tuo data lake da una posizione centrale. È possibile utilizzare il controllo granulare degli accessi di Lake Formation per gestire le risorse esistenti nel catalogo dati e le posizioni di dati di Amazon S3.

Con i dati registrati con Lake Formation, puoi condividere in sicurezza le risorse del Data Catalog tra responsabili, AWS account, AWS organizzazioni e unità organizzative IAM.

Per ulteriori informazioni sulla creazione di risorse Data Catalog utilizzando Lake Formation, consulta Creating Data Catalog tables and database nella AWS Lake Formation Developer Guide.

Amazon Athena

Amazon Athena utilizza il Data Catalog per archiviare e recuperare i metadati delle tabelle per i dati Amazon S3 nel tuo account. AWS I metadati della tabella consentono al motore di query Athena di sapere come trovare, leggere ed elaborare i dati che si desidera interrogare.

È possibile compilare il file AWS Glue Data Catalog utilizzando direttamente le istruzioni CREATE TABLE Athena. È possibile definire e popolare manualmente lo schema e i metadati delle partizioni nel catalogo dati senza dover eseguire un crawler.

  1. Nella console Athena, creare un database che memorizzerà i metadati della tabella nel catalogo dati.

  2. Usare l'istruzione CREATE EXTERNAL TABLE per definire lo schema dell'origine dati.

  3. Usare la clausola PARTITIONED BY per definire eventuali chiavi di partizione se i dati sono partizionati.

  4. Usare la clausola LOCATION per specificare il percorso di Amazon S3 in cui vengono archiviati i file di dati effettivi.

  5. Eseguire l'istruzione CREATE TABLE.

    Questa query crea i metadati della tabella nel catalogo dati in base allo schema e alle partizioni definiti, senza svolgere effettivamente il crawling dei dati.

È possibile interrogare la tabella in Athena, che utilizzerà i metadati dal catalogo dati per accedere e interrogare i file di dati in Amazon S3.

Per ulteriori informazioni, consultare Creare database e tabelle nella guida per l'utente di Amazon Athena.