Librerie JSON SerDe

In Athena, puoi usare le SerDe librerie per deserializzare i dati JSON. La deserializzazione converte i dati JSON in modo che possano essere serializzati (scritti) in un formato diverso come Parquet o ORC.

Nota

Le librerie Hive e OpenX prevedono che i dati JSON siano su una singola riga (non formattati), con registri separati da un carattere di nuova riga.

Poiché Amazon Ion è un superset di JSON, puoi utilizzare Amazon Ion Hive SerDe per interrogare set di dati JSON non Amazon Ion. A differenza delle librerie SerDe JSON Hive e OpenX, Amazon SerDe Ion non prevede che ogni riga di dati si trovi su una singola riga. Questa funzione è utile se si desidera eseguire query su set di dati JSON in formato «pretty print» o se si desidera suddividere i campi di una riga con caratteri di nuova riga.

Nomi delle librerie

Utilizzare una delle seguenti operazioni:

org.apache.hive.hcatalog.data. JsonSerDe

org.openx.data.jsonserde. JsonSerDe

com.amazon.ionhiveserde. IonHiveSerDe

Risorse aggiuntive

Per ulteriori informazioni sull'utilizzo di JSON e JSON nidificato in Athena, vedere le risorse seguenti:

Crea tabelle in Amazon Athena da JSON e mappature annidate utilizzando JSONSer De (Big Data Blog)AWS
Ricevo errori quando cerco di leggere dati JSON in Amazon AthenaAWS (articolo del Knowledge Center)
hive-json-schema(GitHub) — Strumento scritto in Java che genera CREATE TABLE istruzioni a partire da documenti JSON di esempio. Le istruzioni CREATE TABLE generate utilizzano SerDe JSON OpenX.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Grok SerDe

JSON Hive SerDe