Interrogation du AWS Glue Data Catalog
Étant donné que le AWS Glue Data Catalog est utilisé par de nombreux Services AWS comme référentiel central de métadonnées, vous voulez peut-être interroger les métadonnées du catalogue de données. Pour ce faire, vous pouvez utiliser des requêtes SQL dans Athena. Vous pouvez utiliser Athena pour interroger des métadonnées du catalogue AWS Glue telles que des bases de données, des tables, des partitions et des colonnes.
Pour obtenir les métadonnées du catalogue AWS Glue, vous interrogez la base de données information_schema sur le backend Athena. Les exemples de requête de cette rubrique montrent comment utiliser Athena pour interroger les métadonnées du catalogue AWS Glue pour les cas d'utilisation courants.
Considérations et restrictions
-
Au lieu de faire d’interroger la base de données
information_schema, il est possible d'utiliser des commandes DDL Apache Hive individuelles pour extraire des informations sur les métadonnées pour des bases de données, des tables, des vues, des partitions et des colonnes spécifiques à partir d'Athena. Toutefois, le résultat est dans un format non tabulaire. -
Les requêtes à
information_schemasont plus performantes si vous avez une quantité faible à modérée de métadonnées AWS Glue. Si vous disposez d'un grand nombre de métadonnées, des erreurs peuvent se produire. -
Vous ne pouvez pas utiliser
CREATE VIEWpour créer une vue sur la base de donnéesinformation_schema.