AWS Glue Data Catalog abfragen - Amazon Athena

AWS Glue Data Catalog abfragen

Da AWS Glue Data Catalog von vielen AWS-Services als zentrales Metadaten-Repository verwendet wird, möchten Sie möglicherweise Datenkatalog-Metadaten abfragen. Dazu können Sie SQL-Abfragen in Athena verwenden. Sie können Athena verwenden, um AWS Glue-Katalog-Metadaten wie Datenbanken, Tabellen, Partitionen und Spalten abzufragen.

Um AWS Glue-Katalog-Metadaten abzurufen, fragen Sie die information_schema-Datenbank im Athena-Backend ab. In den Beispielabfragen in diesem Thema wird gezeigt, wie Sie Athena verwenden, um AWS Glue-Katalog-Metadaten für häufige Anwendungsfälle abzufragen.

Überlegungen und Einschränkungen

  • Anstatt die information_schema-Datenbank abzufragen, ist es möglich, einzelne Apache-Hive-DDL-Befehle zu verwenden, um Metadateninformationen für bestimmte Datenbanken, Tabellen, Ansichten, Partitionen und Spalten aus Athena zu extrahieren. Die Ausgabe erfolgt jedoch in einem nicht tabellarischen Format.

  • Abfragen von information_schema sind am leistungsstärksten, wenn Sie eine kleine bis mittelgroße Menge an AWS Glue-Metadaten haben. Wenn Sie eine große Menge an Metadaten haben, können Fehler auftreten.

  • Sie können mit CREATE VIEW keine Ansicht in der information_schema-Datenbank erstellen.