AWS Glue Data Catalog abfragen
Da AWS Glue Data Catalog von vielen AWS-Services als zentrales Metadaten-Repository verwendet wird, möchten Sie möglicherweise Datenkatalog-Metadaten abfragen. Dazu können Sie SQL-Abfragen in Athena verwenden. Sie können Athena verwenden, um AWS Glue-Katalog-Metadaten wie Datenbanken, Tabellen, Partitionen und Spalten abzufragen.
Um AWS Glue-Katalog-Metadaten abzurufen, fragen Sie die information_schema-Datenbank im Athena-Backend ab. In den Beispielabfragen in diesem Thema wird gezeigt, wie Sie Athena verwenden, um AWS Glue-Katalog-Metadaten für häufige Anwendungsfälle abzufragen.
Überlegungen und Einschränkungen
-
Anstatt die
information_schema-Datenbank abzufragen, ist es möglich, einzelne Apache-Hive-DDL-Befehle zu verwenden, um Metadateninformationen für bestimmte Datenbanken, Tabellen, Ansichten, Partitionen und Spalten aus Athena zu extrahieren. Die Ausgabe erfolgt jedoch in einem nicht tabellarischen Format. -
Abfragen von
information_schemasind am leistungsstärksten, wenn Sie eine kleine bis mittelgroße Menge an AWS Glue-Metadaten haben. Wenn Sie eine große Menge an Metadaten haben, können Fehler auftreten. -
Sie können mit
CREATE VIEWkeine Ansicht in derinformation_schema-Datenbank erstellen.
Themen
Auflisten von Datenbanken und Durchsuchen einer angegebenen Datenbank
Auflisten von Tabellen in einer angegebenen Datenbank und Suche nach einer Tabelle anhand des Namens
Auflisten oder Durchsuchen von Spalten für eine angegebene Tabelle oder Ansicht
Auflistung der Spalten, die bestimmte Tabellen gemeinsam haben