Eseguire query sul AWS Glue Data Catalog - Amazon Athena

Eseguire query sul AWS Glue Data Catalog

Poiché AWS Glue Data Catalog viene utilizzato da molti Servizi AWS come repository centrale di metadati, è possibile eseguire query sui metadati del catalogo dati. A tale scopo, è possibile utilizzare le query SQL in Athena. È possibile utilizzare Athena per eseguire query sui metadati del catalogo AWS Glue come database, tabelle, partizioni e colonne.

Per ottenere i metadati del catalogo AWS Glue, è possibile eseguire una query sul database information_schema sul back end di Athena. Le query di esempio in questo argomento mostrano come utilizzare Athena per eseguire query sui metadati del catalogo AWS Glue per i casi di utilizzo comuni.

Considerazioni e limitazioni

  • Invece di interrogare il database information_schema, puoi utilizzare i singoli comandi DDLdi Apache Hive per estrarre informazioni sui metadati per database, tabelle, viste, partizioni e colonne specifici da Athena. Tuttavia, l'output è in formato non tabulare.

  • L'interrogazione di information_schema è più performante se disponi di una quantità di metadati AWS Glue da piccola a moderata. Se disponi di una quantità di metadati elevata, possono verificarsi degli errori.

  • Non è possibile utilizzare CREATE VIEW per creare una visualizzazione nel database information_schema.