Librerie SerDe JSON
In Athena, è possibile utilizzare due librerie SerDe per deserializzare i dati JSON. La deserializzazione converte i dati JSON in modo che possano essere serializzati (scritti) in un formato diverso come Parquet o ORC.
Nota
Le librerie Hive e OpenX prevedono che i dati JSON siano su una singola riga (non formattati), con registri separati da un carattere di nuova riga.
Poiché Amazon Ion è un superset di JSON, puoi utilizzare Amazon Ion Hive SerDE per eseguire query su set di dati non Amazon Ion JSON. A differenza delle librerie Hive e OpenX SerDe JSON, Amazon Ion SerDE non prevede che ogni riga di dati si trovi su una singola riga. Questa funzione è utile se si desidera eseguire query su set di dati JSON in formato «pretty print» o se si desidera suddividere i campi di una riga con caratteri di nuova riga.
Nomi delle librerie
Utilizzare una delle seguenti operazioni:
org.apache.hive.hcatalog.data.JsonSerDe
org.openx.data.jsonserde.JsonSerDe
com.amazon.ionhiveserde.IonHiveSerDe
Risorse aggiuntive
Per ulteriori informazioni sull'utilizzo di JSON e JSON nidificato in Athena, vedere le risorse seguenti:
-
Creare tabelle in Amazon Athena da JSON nifìdificati e mappature tramite JSONSerDe
(Blog AWS Big Data) -
Ricevo errori quando provo a leggere i dati JSON in Amazon Athena
(articolo di AWS Knowledge Center) -
hive-json-schema
(GitHub) – Strumento scritto in Java che genera istruzioni CREATE TABLEdai documenti JSON di esempio. Le istruzioniCREATE TABLEgenerate utilizzano SerDe JSON OpenX.