JSON-SerDe-Bibliotheken
In Athena können Sie SerDe-Bibliotheken verwenden, um JSON-Daten zu deserialisieren. Die Deserialisierung wandelt die JSON-Daten so um, dass sie in ein anderes Format wie Parquet oder ORC serialisiert (ausgeschrieben) werden können.
Anmerkung
Die Hive- und OpenX-Bibliotheken erwarten, dass sich JSON-Daten in einer einzelnen Zeile befinden (nicht formatiert), wobei Datensätze durch ein Zeilenumbruchzeichen getrennt sind.
Da Amazon Ion eine Obermenge von JSON ist, können Sie den Amazon Ion Hive SerDe verwenden, um JSON-Datensätze außerhalb von Amazon Ion abzufragen. Im Gegensatz zu den Hive- und OpenX JSON SerDe-Bibliotheken erwartet Amazon Ion SerDe nicht, dass sich jede Datenzeile in einer einzelnen Zeile befindet. Dieses Feature ist nützlich, wenn Sie JSON-Datensätze im „Pretty Print“-Format abfragen oder die Felder in einer Zeile mit Zeilenumbruchzeichen aufteilen möchten.
Bibliotheksnamen
Nutzen Sie einen der Folgenden:
org.apache.hive.hcatalog.data.JsonSerDe
org.openx.data.jsonserde.JsonSerDe
com.amazon.ionhiveserde.IonHiveSerDe
Weitere Ressourcen
Weitere Informationen zum Arbeiten mit JSON und verschachteltem JSON in Athena finden Sie in den folgenden Ressourcen:
-
Erstellen von Tabellen in Amazon Athena aus verschachteltem JSON und Mappings mit JSONSerDe
(AWS Big Data Blog) -
Ich erhalte Fehler, wenn ich versuche, JSON-Daten in Amazon Athena zu lesen
(AWS Knowledge Center-Artikel) -
hive-json-schema
(GitHub) – Tool in Java, das CREATE TABLE-Anweisungen aus Beispiel-JSON-Dokumenten generiert. Die generiertenCREATE TABLEAnweisungen verwenden den OpenX JSON Serde.