View a markdown version of this page

Zugreifen auf Tabellendaten - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Zugreifen auf Tabellendaten

Es gibt mehrere Möglichkeiten, auf Tabellen in Amazon S3 S3-Tabellen-Buckets zuzugreifen. Sie können Tabellen mithilfe AWS Glue Data Catalog des Amazon S3 AWS Iceberg REST Tables-Endpunkts oder des Amazon S3-Tabellenkatalogs für in Analyseservices integrieren oder direkt auf Tabellen zugreifenApache Iceberg. Welche Zugriffsmethode Sie verwenden, hängt von Ihrer Katalogeinrichtung, Ihrem Verwaltungsmodell und Ihren Anforderungen an die Zugriffskontrolle ab. Im Folgenden finden Sie eine Übersicht über diese Zugriffsmethoden.

AWS Glue Data Catalog Integration

Dies ist die empfohlene Zugriffsmethode für die Arbeit mit Tabellen in S3-Tabellen-Buckets. Diese Integration bietet Ihnen einen einheitlichen Überblick über Ihren Datenbestand in mehreren AWS Analysediensten über die AWS Glue Data Catalog. Nach der Integration können Sie Tabellen mithilfe von Diensten wie Athena und Amazon Redshift abfragen. Der Zugriff auf Tabellen wird mithilfe von IAM-Berechtigungen verwaltet. Um mithilfe dieser Integration auf Tabellen zuzugreifen, benötigt die von Ihnen verwendete IAM-Identität Zugriff auf Ihre Ressourcen und Aktionen, AWS Glue Data Catalog Objekte und die von Ihnen verwendete Abfrage-Engine in S3 Tables. Weitere Informationen finden Sie unter Zugriffsverwaltung für S3 Tables.

Direkter Zugriff

Verwenden Sie diese Methode, wenn Sie mit AWS Partner Network (APN-) Katalogimplementierungen oder benutzerdefinierten Katalogimplementierungen arbeiten müssen oder wenn Sie nur grundlegende read/write Operationen für Tabellen innerhalb eines einzelnen Tabellen-Buckets ausführen müssen. Der Zugriff auf Tabellen wird mithilfe von IAM-Berechtigungen verwaltet. Um auf Tabellen zugreifen zu können, benötigt die von Ihnen verwendete IAM-Identität Zugriff auf Ihre Tabellenressourcen und S3-Tabelles-Aktionen. Weitere Informationen finden Sie unter Zugriffsverwaltung für S3 Tables.

Über die Integration auf Tabellen zugreifen AWS Glue Data Catalog

Sie können S3-Tabellen-Buckets integrieren, AWS Glue Data Catalog um auf Tabellen von AWS Analysediensten wie Amazon Athena, Amazon Redshift und Quick zuzugreifen. Die Integration füllt die AWS Glue Data Catalog mit Ihren Tabellenressourcen und bündelt den Zugriff auf diese Ressourcen. Weitere Informationen zur Integration finden Sie unter Integration von Amazon S3 S3-Tabellen mit AWS Analysediensten.

Die folgenden AWS Analysedienste können über diese Integration auf Tabellen zugreifen:

Über den AWS GlueIceberg REST-Endpunkt auf Tabellen zugreifen

Sobald Ihre S3-Tabellen-Buckets integriert sind AWS Glue Data Catalog, können Sie den AWS GlueIceberg REST Endpunkt auch verwenden, um eine Verbindung zu S3-Tabellen von Abfrage-Engines von Drittanbietern herzustellen, die dies unterstützenIceberg. Weitere Informationen finden Sie unter Zugreifen auf Amazon-S3-Tabellen über den AWS GlueIceberg REST-Endpunkt.

Wir empfehlen, den AWS GlueIceberg REST-Endpunkt zu verwenden, wenn Sie auf Tabellen von Spark, PyIceberg, oder anderen Iceberg-kompatiblen Clients zugreifen möchten.

Die folgenden Clients können direkt über den AWS GlueIceberg REST-Endpunkt auf Tabellen zugreifen:

  • Jeder Iceberg Client, einschließlich Spark, PyIceberg und mehr.

Direktes Zugreifen auf Tabellen

Über Methoden, die die Verwaltung von S3-Tables mit Ihren Apache Iceberg-Analytikanwendungen verbinden, können Sie direkt von Open-Source-Abfrage-Engines aus auf Tabellen zugreifen. Es gibt zwei Direktzugriffsmethoden: den Amazon-S3-Tables-Iceberg REST Endpunkt oder den Amazon S3 Tables Catalog für Apache Iceberg. Der REST-Endpunkt wird empfohlen.

Wir empfehlen den Direktzugriff, wenn Sie in selbstverwalteten Katalogimplementierungen auf Tabellen zugreifen oder nur grundlegende read/write Operationen für Tabellen in einem einzelnen Tabellen-Bucket ausführen müssen. Für andere Zugriffsszenarien empfehlen wir die AWS Glue Data Catalog Integration.

Der direkte Zugriff auf Tabellen wird entweder über identitätsbasierte IAM-Richtlinien oder über ressourcenbasierte Richtlinien verwaltet, die an Tabellen und Tabellen-Buckets angehängt sind.

Zugreifen auf Tabellen über den Amazon S3 Tables Iceberg REST-Endpunkt

Sie können den Amazon S3 Tables Iceberg REST-Endpunkt verwenden, um direkt von allen Iceberg REST-kompatiblen Clients über HTTP-Endpunkte auf Ihre Tabellen zuzugreifen. Weitere Informationen finden Sie unter Zugreifen auf Tabellen über den Amazon S3 Tables Iceberg REST-Endpunkt.

Die folgenden AWS Analysedienste und Abfrage-Engines können über den Amazon S3 Iceberg REST Tables-Endpunkt direkt auf Tabellen zugreifen:

Unterstützte Engines

Direkter Zugriff auf Tabellen über den Amazon S3 Tables Catalog für Apache Iceberg

Sie können auch direkt von Abfrage-Engines wie Apache Spark aus auf Tabellen zugreifen, z. B. mithilfe des S3-Tables-Client-Katalogs. Weitere Informationen finden Sie unter Zugreifen auf Amazon-S3-Tabellen mit dem Amazon-S3-Tables-Katalog für Apache Iceberg. S3 empfiehlt jedoch, den Amazon S3 Tables Iceberg REST-Endpunkt für den direkten Zugriff zu verwenden, da dieser mehr Anwendungen unterstützt, ohne dass sprach- oder maschinenspezifischer Code erforderlich ist.

Die folgenden Abfrage-Engines können über den Client-Katalog direkt auf Tabellen zugreifen: