Noms des bibliothèques Ressources supplémentaires

SerDe bibliothèques JSON

Dans Athena, vous pouvez utiliser des SerDe bibliothèques pour désérialiser les données JSON. La désérialisation convertit les données JSON afin qu'elles puissent être sérialisées (écrites) dans un format différent comme Parquet ou ORC.

Note

Les bibliothèques Hive et OpenX s'attendent à ce que les données JSON soient sur une seule ligne (non formatées), les registres étant séparés par un caractère de nouvelle ligne.

Amazon Ion étant un sur-ensemble de JSON, vous pouvez utiliser Amazon Ion Hive SerDe pour interroger des ensembles de données JSON autres qu'Amazon Ion. Contrairement aux bibliothèques SerDe JSON Hive et OpenX, Amazon SerDe Ion ne s'attend pas à ce que chaque ligne de données se trouve sur une seule ligne. Cette fonction est utile si vous souhaitez interroger des jeux de données JSON au format « pretty print » ou si vous souhaitez diviser les champs d'une ligne avec des caractères de saut de ligne.

Noms des bibliothèques

Utilisez l'une des options suivantes :

org.apache.hive.hcatalog.data. JsonSerDe

org.openx.data.json. JsonSerDe

com.amazon.ionhiveserde. IonHiveSerDe

Ressources supplémentaires

Pour de plus amples informations sur l'utilisation de JSON et de JSON imbriqué dans Athena, consultez les ressources suivantes :

Créez des tables dans Amazon Athena à partir de JSON imbriqué et de mappages à l'aide JSONSer de De (AWS Big Data Blog)
Je reçois des erreurs lorsque j'essaie de lire des données JSON dans Amazon Athena (article du AWS Knowledge Center)
hive-json-schema(GitHub) — Outil écrit en Java qui génère des CREATE TABLE instructions à partir d'exemples de documents JSON. Les instructions CREATE TABLE générées utilisent le SerDe JSON OpenX.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Grok SerDe

Hive JSON SerDe