Eseguire query sul AWS Glue Data Catalog
Poiché AWS Glue Data Catalog viene utilizzato da molti Servizi AWS come repository centrale di metadati, è possibile eseguire query sui metadati del catalogo dati. A tale scopo, è possibile utilizzare le query SQL in Athena. È possibile utilizzare Athena per eseguire query sui metadati del catalogo AWS Glue come database, tabelle, partizioni e colonne.
Per ottenere i metadati del catalogo AWS Glue, è possibile eseguire una query sul database information_schema sul back end di Athena. Le query di esempio in questo argomento mostrano come utilizzare Athena per eseguire query sui metadati del catalogo AWS Glue per i casi di utilizzo comuni.
Considerazioni e limitazioni
-
Invece di interrogare il database
information_schema, puoi utilizzare i singoli comandi DDLdi Apache Hive per estrarre informazioni sui metadati per database, tabelle, viste, partizioni e colonne specifici da Athena. Tuttavia, l'output è in formato non tabulare. -
L'interrogazione di
information_schemaè più performante se disponi di una quantità di metadati AWS Glue da piccola a moderata. Se disponi di una quantità di metadati elevata, possono verificarsi degli errori. -
Non è possibile utilizzare
CREATE VIEWper creare una visualizzazione nel databaseinformation_schema.