Scegli un file SerDe per i tuoi dati

La tabella seguente elenca i formati di dati supportati in Athena e le librerie corrispondenti SerDe .

Formati di dati supportati e SerDes
Formato dei dati	Description	SerDe tipi supportati in Athena
Amazon Ion	Amazon Ion è un formato di dati altamente tipizzato e autodescrittivo ed è un superset di JSON, sviluppato e reso disponibile in open source da Amazon.	Utilizza il Amazon Ion Hive SerDe.
Apache Avro	Un formato per archiviare i dati in Hadoop che impiega schemi basati su JSON per i valori dei record.	Utilizzo della Avro SerDe
Apache Parquet	Un formato per storage colonnare di dati in Hadoop.	Utilizzare la compressione SNAPPY e Parquet SerDe.
registri di Apache WebServer	Un formato per l'archiviazione dei log in Apache. WebServer	Utilizzare Grok SerDe o Regex SerDe.
CloudTrail registri	Un formato per l'archiviazione dei log in. CloudTrail	Utilizzo della JSON Hive SerDe. Per ulteriori informazioni, consulta AWS CloudTrail Registri delle interrogazioni.
CSV (valori separati da virgola)	Per i dati in CSV, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da virgole.	Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato se i dati non includono valori racchiusi tra virgolette o se usano il formato `java.sql.Timestamp`. Utilizzare Apri CSV SerDe per l'elaborazione di CSV quando i dati includono virgolette nei valori o usano il formato numerico UNIX per `TIMESTAMP` (ad esempio, `1564610311`).
Delimitatore personalizzato	Per i dati in questo formato, ogni riga rappresenta un record di dati e i record sono separati da delimitatori personalizzati a carattere singolo.	Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato e specificare un delimitatore di carattere singolo personalizzato.
JSON (notazione di JavaScript oggetti)	Per i dati in JSON, ogni riga rappresenta un registro di dati e ogni registro è composto da coppie attributo-valore e da matrici, separate da virgole.	Utilizzo della JSON Hive SerDe Utilizzo della OpenX JSON SerDe
Log di Logstash	Formato per archiviare log in Logstash.	Utilizzo della Grok SerDe
ORC (Optimized Row Columnar)	Un formato per storage colonnare ottimizzato basato su dati Hive.	Utilizzare la compressione ZLIB e ORCO SerDe.
TSV (valori separati da tabulazione)	Per i dati in TSV, ogni riga rappresenta un record di dati e ogni record è composto da uno o più campi, separati da tabulazioni.	Utilizzare Lazy SerDe Simple per file CSV, TSV e delimitati in modo personalizzato e specificare il carattere separatore come `FIELDS TERMINATED BY '\t'`.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Usa SerDes

Usa a SerDe per creare una tabella