JSON-SerDe-Bibliotheken - Amazon Athena

JSON-SerDe-Bibliotheken

In Athena können Sie SerDe-Bibliotheken verwenden, um JSON-Daten zu deserialisieren. Die Deserialisierung wandelt die JSON-Daten so um, dass sie in ein anderes Format wie Parquet oder ORC serialisiert (ausgeschrieben) werden können.

Anmerkung

Die Hive- und OpenX-Bibliotheken erwarten, dass sich JSON-Daten in einer einzelnen Zeile befinden (nicht formatiert), wobei Datensätze durch ein Zeilenumbruchzeichen getrennt sind.

Da Amazon Ion eine Obermenge von JSON ist, können Sie den Amazon Ion Hive SerDe verwenden, um JSON-Datensätze außerhalb von Amazon Ion abzufragen. Im Gegensatz zu den Hive- und OpenX JSON SerDe-Bibliotheken erwartet Amazon Ion SerDe nicht, dass sich jede Datenzeile in einer einzelnen Zeile befindet. Dieses Feature ist nützlich, wenn Sie JSON-Datensätze im „Pretty Print“-Format abfragen oder die Felder in einer Zeile mit Zeilenumbruchzeichen aufteilen möchten.

Bibliotheksnamen

Nutzen Sie einen der Folgenden:

org.apache.hive.hcatalog.data.JsonSerDe

org.openx.data.jsonserde.JsonSerDe

com.amazon.ionhiveserde.IonHiveSerDe

Weitere Ressourcen

Weitere Informationen zum Arbeiten mit JSON und verschachteltem JSON in Athena finden Sie in den folgenden Ressourcen: