Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
SerDe JSON-Bibliotheken
In Athena können Sie SerDe Bibliotheken verwenden, um JSON-Daten zu deserialisieren. Die Deserialisierung wandelt die JSON-Daten so um, dass sie in ein anderes Format wie Parquet oder ORC serialisiert (ausgeschrieben) werden können.
Anmerkung
Die Hive- und OpenX-Bibliotheken erwarten, dass sich JSON-Daten in einer einzelnen Zeile befinden (nicht formatiert), wobei Datensätze durch ein Zeilenumbruchzeichen getrennt sind.
Da Amazon Ion ein Superset von JSON ist, können Sie Amazon Ion Hive verwenden, um JSON-Datensätze abzufragen SerDe , die nicht zu Amazon Ion gehören. Im Gegensatz zu den SerDe JSON-Bibliotheken Hive und OpenX erwartet Amazon Ion SerDe nicht, dass sich jede Datenzeile in einer einzigen Zeile befindet. Dieses Feature ist nützlich, wenn Sie JSON-Datensätze im „Pretty Print“-Format abfragen oder die Felder in einer Zeile mit Zeilenumbruchzeichen aufteilen möchten.
Bibliotheksnamen
Nutzen Sie einen der Folgenden:
org.apache.hive.hcatalog.data. JsonSerDe
org.openx.data.jsonserde. JsonSerDe
com.amazon.ionhiveserde. IonHiveSerDe
Weitere Ressourcen
Weitere Informationen zum Arbeiten mit JSON und verschachteltem JSON in Athena finden Sie in den folgenden Ressourcen:
-
Erstellen Sie Tabellen in Amazon Athena aus verschachteltem JSON und Zuordnungen mit JSONSer De
(AWS Big Data Blog) -
Ich erhalte Fehler, wenn ich versuche, JSON-Daten in Amazon Athena zu lesen
(AWS Knowledge Center-Artikel) -
hive-json-schema
(GitHub) — In Java geschriebenes Tool, das CREATE TABLEAnweisungen aus JSON-Beispieldokumenten generiert. Die generiertenCREATE TABLEAnweisungen verwenden den OpenX JSON Serde.