Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Integrazione con altri servizi AWS
Sebbene sia possibile utilizzare Crawler di AWS Glue s per compilarli AWS Glue Data Catalog, esistono diversi AWS servizi che possono integrarsi e popolare automaticamente nel catalogo. Le sezioni seguenti forniscono ulteriori informazioni sui casi d'uso specifici supportati dai AWS servizi che possono popolare il Data Catalog.
Argomenti
AWS Lake Formation
AWS Lake Formation è un servizio che semplifica la configurazione di un data lake sicuro. AWS Lake Formation è costruita su AWS Glue, e Lake Formation AWS Glue condividiamo la stessa cosa AWS Glue Data Catalog. Puoi registrare la tua posizione dati Amazon S3 con Lake Formation e utilizzare la console Lake Formation per creare database e tabelle nel AWS Glue Data Catalog, definire politiche di accesso ai dati e controllare l'accesso ai dati attraverso il tuo data lake da una posizione centrale. È possibile utilizzare il controllo granulare degli accessi di Lake Formation per gestire le risorse esistenti nel catalogo dati e le posizioni di dati di Amazon S3.
Con i dati registrati con Lake Formation, puoi condividere in sicurezza le risorse del Data Catalog tra responsabili, AWS account, AWS organizzazioni e unità organizzative IAM.
Per ulteriori informazioni sulla creazione di risorse Data Catalog utilizzando Lake Formation, consulta Creating Data Catalog tables and database nella AWS Lake Formation Developer Guide.
Amazon Athena
Amazon Athena utilizza il Data Catalog per archiviare e recuperare i metadati delle tabelle per i dati Amazon S3 nel tuo account. AWS I metadati della tabella consentono al motore di query Athena di sapere come trovare, leggere ed elaborare i dati che si desidera interrogare.
È possibile compilare il file AWS Glue Data Catalog utilizzando direttamente le istruzioni CREATE TABLE Athena. È possibile definire e popolare manualmente lo schema e i metadati delle partizioni nel catalogo dati senza dover eseguire un crawler.
Nella console Athena, creare un database che memorizzerà i metadati della tabella nel catalogo dati.
Usare l'istruzione
CREATE EXTERNAL TABLEper definire lo schema dell'origine dati.Usare la clausola
PARTITIONED BYper definire eventuali chiavi di partizione se i dati sono partizionati.Usare la clausola
LOCATIONper specificare il percorso di Amazon S3 in cui vengono archiviati i file di dati effettivi.Eseguire l'istruzione
CREATE TABLE.Questa query crea i metadati della tabella nel catalogo dati in base allo schema e alle partizioni definiti, senza svolgere effettivamente il crawling dei dati.
È possibile interrogare la tabella in Athena, che utilizzerà i metadati dal catalogo dati per accedere e interrogare i file di dati in Amazon S3.
Per ulteriori informazioni, consultare Creare database e tabelle nella guida per l'utente di Amazon Athena.