Zugreifen auf Tabellen über AWS Glue Data Catalog Integration Direktes Zugreifen auf Tabellen

Zugreifen auf Tabellendaten

Es gibt mehrere Möglichkeiten, auf Tabellen in Amazon S3 S3-Tabellen-Buckets zuzugreifen. Sie können Tabellen mithilfe AWS Glue Data Catalog des Amazon Iceberg REST S3-Tabellen-Endpunkts oder des Amazon S3 S3-Tabellenkatalogs für in AWS Analyseservices integrieren oder direkt auf Tabellen zugreifenApache Iceberg. Welche Zugriffsmethode Sie verwenden, hängt von Ihrer Katalogeinrichtung, Ihrem Verwaltungsmodell und Ihren Anforderungen an die Zugriffskontrolle ab. Im Folgenden finden Sie eine Übersicht über diese Zugriffsmethoden.

AWS Glue Data Catalog Integration: Dies ist die empfohlene Zugriffsmethode für die Arbeit mit Tabellen in S3-Tabellen-Buckets. Diese Integration bietet Ihnen einen einheitlichen Überblick über Ihren Datenbestand in mehreren AWS Analysediensten über die AWS Glue Data Catalog. Nach der Integration können Sie Tabellen mithilfe von Diensten wie Athena und Amazon Redshift abfragen. Der Zugriff auf Tabellen wird mithilfe von IAM-Berechtigungen verwaltet. Um mithilfe dieser Integration auf Tabellen zuzugreifen, benötigt die von Ihnen verwendete IAM-Identität Zugriff auf Ihre Ressourcen und Aktionen, AWS Glue Data Catalog Objekte und die von Ihnen verwendete Abfrage-Engine in S3 Tables. Weitere Informationen finden Sie unter Zugriffsverwaltung für S3 Tables.
Direkter Zugriff: Verwenden Sie diese Methode, wenn Sie mit AWS Partner Network (APN-) Katalogimplementierungen oder benutzerdefinierten Katalogimplementierungen arbeiten müssen oder wenn Sie nur grundlegende read/write Operationen für Tabellen innerhalb eines einzelnen Tabellen-Buckets ausführen müssen. Der Zugriff auf Tabellen wird mithilfe von IAM-Berechtigungen verwaltet. Um auf Tabellen zugreifen zu können, benötigt die von Ihnen verwendete IAM-Identität Zugriff auf Ihre Tabellenressourcen und S3-Tabelles-Aktionen. Weitere Informationen finden Sie unter Zugriffsverwaltung für S3 Tables.

Zugreifen auf Tabellen über AWS Glue Data Catalog Integration

Sie können S3-Tabellen-Buckets integrieren, AWS Glue Data Catalog um auf Tabellen von AWS Analysediensten wie Amazon Athena, Amazon Redshift und Quick zuzugreifen. Die Integration füllt die AWS Glue Data Catalog mit Ihren Tabellenressourcen und bündelt den Zugriff auf diese Ressourcen. Weitere Informationen zur Integration finden Sie unter Integration von Amazon S3 S3-Tabellen mit AWS Analysedienste.

Die folgenden AWS Analysedienste können über diese Integration auf Tabellen zugreifen:

Zugreifen auf Tabellen mithilfe der AWS Glue Iceberg-REST Endpunkt

Sobald Ihre S3-Tabellen-Buckets integriert sind AWS Glue Data Catalog, können Sie den AWS GlueIceberg REST Endpunkt auch verwenden, um eine Verbindung zu S3-Tabellen von Abfrage-Engines von Drittanbietern herzustellen, die dies unterstützenIceberg. Weitere Informationen finden Sie unter Zugreifen auf Amazon S3 S3-Tabellen mit dem AWS Glue Iceberg-REST Endpunkt.

Wir empfehlen, den AWS GlueIceberg REST-Endpunkt zu verwenden, wenn Sie auf Tabellen von Spark, PyIceberg, oder anderen Iceberg-kompatiblen Clients zugreifen möchten.

Die folgenden Clients können direkt über den AWS GlueIceberg REST-Endpunkt auf Tabellen zugreifen:

Jeder Iceberg Client, einschließlich Spark, PyIceberg und mehr.

Direktes Zugreifen auf Tabellen

Über Methoden, die die Verwaltung von S3-Tables mit Ihren Apache Iceberg-Analytikanwendungen verbinden, können Sie direkt von Open-Source-Abfrage-Engines aus auf Tabellen zugreifen. Es gibt zwei Direktzugriffsmethoden: den Amazon-S3-Tables-Iceberg REST Endpunkt oder den Amazon S3 Tables Catalog für Apache Iceberg. Der REST-Endpunkt wird empfohlen.

Wir empfehlen den Direktzugriff, wenn Sie in selbstverwalteten Katalogimplementierungen auf Tabellen zugreifen oder nur grundlegende read/write Operationen für Tabellen in einem einzelnen Tabellen-Bucket ausführen müssen. Für andere Zugriffsszenarien empfehlen wir die AWS Glue Data Catalog Integration.

Der direkte Zugriff auf Tabellen wird entweder über identitätsbasierte IAM-Richtlinien oder über ressourcenbasierte Richtlinien verwaltet, die an Tabellen und Tabellen-Buckets angehängt sind.

Zugreifen auf Tabellen über die Amazon S3 S3-Tabellen Iceberg-REST Endpunkt

Sie können den Amazon S3 Tables Iceberg REST-Endpunkt verwenden, um direkt von allen Iceberg REST-kompatiblen Clients über HTTP-Endpunkte auf Ihre Tabellen zuzugreifen. Weitere Informationen finden Sie unter Zugreifen auf Tabellen mithilfe der Amazon S3 S3-Tabellen Iceberg-REST Endpunkt.

Die folgenden AWS Analysedienste und Abfrage-Engines können über den Amazon S3 Iceberg REST Tables-Endpunkt direkt auf Tabellen zugreifen:

Unterstützte Engines

Jeder Iceberg Client, einschließlich Spark, PyIceberg und mehr.
Amazon EMR
AWS Glue ETL

Direkter Zugriff auf Tabellen über den Amazon S3 S3-Tabellenkatalog für Apache Iceberg

Sie können auch direkt von Abfrage-Engines wie Apache Spark aus auf Tabellen zugreifen, z. B. mithilfe des S3-Tables-Client-Katalogs. Weitere Informationen finden Sie unter Zugreifen auf Amazon S3 S3-Tabellen mit dem Amazon S3 S3-Tabellenkatalog für Apache Iceberg. S3 empfiehlt jedoch, den Amazon S3 Tables Iceberg REST-Endpunkt für den direkten Zugriff zu verwenden, da dieser mehr Anwendungen unterstützt, ohne dass sprach- oder maschinenspezifischer Code erforderlich ist.

Die folgenden Abfrage-Engines können über den Client-Katalog direkt auf Tabellen zugreifen:

Apache Spark

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Löschen eines Tags aus einer Tabelle

Überblick über die Integration von S3 Tables