SerDe JSON-Bibliotheken

In Athena können Sie SerDe Bibliotheken verwenden, um JSON-Daten zu deserialisieren. Die Deserialisierung wandelt die JSON-Daten so um, dass sie in ein anderes Format wie Parquet oder ORC serialisiert (ausgeschrieben) werden können.

Anmerkung

Die Hive- und OpenX-Bibliotheken erwarten, dass sich JSON-Daten in einer einzelnen Zeile befinden (nicht formatiert), wobei Datensätze durch ein Zeilenumbruchzeichen getrennt sind.

Da Amazon Ion ein Superset von JSON ist, können Sie Amazon Ion Hive verwenden, um JSON-Datensätze abzufragen SerDe , die nicht zu Amazon Ion gehören. Im Gegensatz zu den SerDe JSON-Bibliotheken Hive und OpenX erwartet Amazon Ion SerDe nicht, dass sich jede Datenzeile in einer einzigen Zeile befindet. Dieses Feature ist nützlich, wenn Sie JSON-Datensätze im „Pretty Print“-Format abfragen oder die Felder in einer Zeile mit Zeilenumbruchzeichen aufteilen möchten.

Bibliotheksnamen

Nutzen Sie einen der Folgenden:

org.apache.hive.hcatalog.data. JsonSerDe

org.openx.data.jsonserde. JsonSerDe

com.amazon.ionhiveserde. IonHiveSerDe

Weitere Ressourcen

Weitere Informationen zum Arbeiten mit JSON und verschachteltem JSON in Athena finden Sie in den folgenden Ressourcen:

Erstellen Sie Tabellen in Amazon Athena aus verschachteltem JSON und Zuordnungen mit JSONSer De (AWS Big Data Blog)
Ich erhalte Fehler, wenn ich versuche, JSON-Daten in Amazon Athena zu lesen (AWS Knowledge Center-Artikel)
hive-json-schema(GitHub) — In Java geschriebenes Tool, das CREATE TABLE Anweisungen aus JSON-Beispieldokumenten generiert. Die generierten CREATE TABLE Anweisungen verwenden den OpenX JSON Serde.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Grok SerDe

Hive-JSON SerDe