Überlegungen und Einschränkungen

Berücksichtigen Sie bei der Verwendung des Apache-Hudi-Tabellen die folgenden Punkte.

Lese- und Schreiboperationen — Athena kann komprimierte Hudi-Datensätze lesen, aber keine Hudi-Daten schreiben.
Hudi-Versionen — Athena unterstützt die Hudi-Versionen 0.14.0 (Standard) und 0.15.0. Athena kann die Lesekompatibilität mit Tabellen, die mit späteren Versionen von Hudi erstellt wurden, nicht garantieren. Weitere Informationen zu Hudi-Features und Versionsverwaltung finden Sie in der Hudi-Dokumentation auf der Apache-Website. Beachten Sie, dass Version 0.15.0 des Hudi-Connectors auf Athena keine Bootstrap-Tabellen unterstützt. Um 0.15.0 des Hudi-Connectors zu verwenden, legen Sie die folgende Tabelleneigenschaft fest:
```
ALTER TABLE table_name SET TBLPROPERTIES ('athena_enable_native_hudi_connector_implementation' = 'true')
```
Kontenübergreifende Abfragen — Version 0.15.0 des Hudi-Connectors unterstützt keine kontenübergreifenden Abfragen.
Abfragetypen — Derzeit unterstützt Athena Snapshot-Abfragen und leseoptimierte Abfragen, jedoch keine inkrementellen Abfragen. In MoR-Tabellen werden alle Daten, die leseoptimierten Abfragen ausgesetzt sind, komprimiert. Dies bietet eine gute Leistung, enthält jedoch nicht die neuesten Delta-Commits. Snapshot-Abfragen enthalten die aktuellsten Daten, verursachen jedoch einen gewissen Rechenaufwand, wodurch diese Abfragen weniger leistungsfähig sind. Weitere Informationen zu den Kompromissen zwischen Tabellen- und Abfragetypen finden Sie unter Tabellen- und Abfragetypen in der Apache-Hudi-Dokumentation.
Inkrementelle Abfragen – Athena unterstützt keine inkrementellen Abfragen.
CTAS – Athena unterstützt nicht CTAS oder INSERT INTO auf Hudi-Daten. Wenn Sie Athena-Unterstützung beim Schreiben von Hudi-Datensätzen wünschen, senden Sie Feedback an <athena-feedback@amazon.com>.

Weitere Informationen zum Schreiben von Hudi-Daten finden Sie in den folgenden Ressourcen:
- Arbeiten mit einem Hudi-Datensatz im Amazon-EMR-Versionshandbuch.
- Schreiben von Daten in der Apache-Hudi-Dokumentation.
MSCK REPAIR TABLE – Die Verwendung von MSCK REPAIR TABLE auf Hudi-Tabellen in Athena wird nicht unterstützt. Wenn Sie eine Hudi-Tabelle laden müssen, in AWS Glue der nicht erstellt wurde, verwenden Sie. ALTER TABLE ADD PARTITION
Überspringen von Amazon-Glacier-Objekten wird nicht unterstützt – Wenn sich Objekte in der Apache–Hudi-Tabelle in einer Amazon-Glacier-Speicherklasse befinden, hat das Setzen der read_restored_glacier_objects-Tabelleneigenschaft auf false keine Auswirkung.

Angenommen, Sie führen den folgenden Befehl aus:
```
ALTER TABLE table_name SET TBLPROPERTIES ('read_restored_glacier_objects' = 'false')
```
Bei Iceberg- und Delta-Lake-Tabellen erzeugt der Befehl den Fehler Unsupported table property key: read_restored_glacier_objects. Bei Hudi-Tabellen erzeugt der ALTER TABLE-Befehl keinen Fehler, aber Amazon-Glacier-Objekte werden immer noch nicht übersprungen. Beim Ausführen von SELECT-Abfragen nach dem ALTER TABLE-Befehl werden weiterhin alle Objekte zurückgegeben.
Zeitstempelabfragen – Derzeit schlagen Abfragen, die versuchen, Zeitstempelspalten in Hudi-Echtzeittabellen zu lesen, entweder fehl oder liefern leere Ergebnisse. Diese Einschränkung gilt nur für Abfragen, die eine Zeitstempelspalte lesen. Abfragen, die nur Spalten ohne Zeitstempel aus derselben Tabelle enthalten, sind erfolgreich.

Fehlgeschlagene Abfragen geben eine Meldung ähnlich der folgenden zurück:

GENERIC_INTERNAL_ERROR: Klasse org.apache.hadoop.io. ArrayWritablekann nicht in die Klasse org.apache.hadoop.hive.serde2.io umgewandelt werden. TimestampWritableV2 (org.apache.hadoop.io). ArrayWritable und org.apache.hadoop.hive.serde2.io. TimestampWritableV2 befinden sich im unbenannten Modul des Loaders io.trino.server. PluginClassLoader @75c67992)
Lake Formation Formation-Berechtigungen auf Hudi Connector 0.15.0 — Diese Einschränkung gilt nur, wenn Sie sich für die Verwendung des nativen Hudi-Connectors (Version 0.15.0) entscheiden, indem Sie die Tabelleneigenschaft auf setzen. athena_enable_native_hudi_connector_implementation true Standardmäßig verwendet Athena die Hudi-Connector-Version 0.14.0, für die diese zusätzliche Berechtigung nicht erforderlich ist. Um eine durch Lake Formation geschützte Tabelle abzufragen, müssen Sie Lake Formation Formation-Berechtigungen sowohl für den Datenspeicherort der Tabelle als auch für das .hoodie Metadatenverzeichnis gewähren. Wenn sich Ihre Hudi-Tabelle beispielsweise in befindets3://bucket/hudi-table/, müssen Sie sich registrieren s3://bucket/hudi-table/ und sowohl in Lake Formation als auch s3://bucket/hudi-table/.hoodie/ in Lake Formation Berechtigungen erteilen. Das .hoodie Verzeichnis enthält Metadatendateien (z. B.hoodie.properties), die Athena während der Abfrageplanung lesen muss. Ohne Berechtigungen für das .hoodie Verzeichnis schlagen Abfragen fehl und es wird die Fehlermeldung „Zugriff verweigert“ angezeigt.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Abfragen von Hudi-Datensätzen

Beispiele für Copy on Write