Von Athena generierte Pfadextraktoren verwenden
Standardmäßig sucht Athena nach Amazon-Ion-Werten der obersten Ebene, die Hive-Spaltennamen entsprechen, und erstellt zur Laufzeit Pfad-Extraktoren basierend auf diesen übereinstimmenden Werten. Wenn Ihr Amazon-Ion-Datenformat mit dem Hive-Tabellenschema übereinstimmt, generiert Athena die Extraktoren dynamisch für Sie und Sie müssen keine zusätzlichen Pfad-Extraktoren hinzufügen. Diese Standard-Pfad-Extraktoren werden nicht in den Tabellen-Metadaten gespeichert.
Im folgenden Beispiel wird gezeigt, wie Athena Extraktoren basierend auf dem Spaltennamen generiert.
-- Example Amazon Ion Document { identification: { name: "John Smith", driver_license: "XXXX" }, alias: "Johnny" } -- Example DDL CREATE EXTERNAL TABLE example_schema2 ( identification MAP<STRING, STRING>, alias STRING ) STORED AS ION LOCATION 's3://amzn-s3-demo-bucket/path_extraction1/'
Die folgenden Beispiel-Extraktoren werden von Athena generiert. Der erste extrahiert das identification-Feld in die identification-Spalte und der zweite extrahiert das alias-Feld in die alias-Spalte.
'ion.identification.path_extractor' = '(identification)' 'ion.alias.path_extractor' = '(alias)'
Das folgende Beispiel zeigt die extrahierte Tabelle.
| identification | alias | |----------------------------------------------------|----------| |{["name", "driver_license"],["John Smith", "XXXX"]} | "Johnny" |