Geodaten abfragen
Koordinatenbasierte Daten enthalten Kennungen, die eine geografische Position für ein Objekt angeben. Zu den Beispielen für diese Art von Daten zählen Wetterberichte, Wegbeschreibungen, Tweets mit geografischen Positionen, Filialstandorte und Flugrouten. Koordinatenbasierte Daten spielen eine wichtige Rolle bei Geschäftsanalysen, der Berichterstattung und bei Vorhersagen.
Geografische Kennungen, wie z. B. Längen- und Breitengrade, ermöglichen das Umwandeln von Postanschriften in geografische Koordinaten.
Was ist eine koordinatenbasierte Abfrage?
Koordinatenbasierte Abfragen sind spezielle SQL-Abfragen, die in Athena unterstützt werden. Sie unterscheiden sich von nicht koordinatenbezogenen SQL-Abfragen wie folgt:
-
Verwendung der folgenden spezialisierten Geometrie-Datentypen:
pointline,multiline,polygonundmultipolygon. -
Angeben von Beziehungen zwischen Geometrie-Datentypen wie
distance,equals,crosses,touches,overlaps,disjointund anderen.
Mit koordinatenbasierten Abfragen in Athena können Sie diese und ähnliche Operationen ausführen:
-
Ermitteln Sie den Abstand zwischen zwei Punkten.
-
Überprüfen Sie, ob ein Bereich (Polygon) ein weiteres enthält.
-
Feststellen, ob eine Linie eine andere oder ein Polygon berührt oder schneidet.
Um beispielsweise einen Geometriedatentyp point aus Werten des Typs double für die geografischen Koordinaten des Mount Rainier in Athena zu erhalten, verwenden Sie die Geodatenfunktion ST_Point (longitude, latitude) wie im folgenden Beispiel.
ST_Point(-121.7602, 46.8527)
Eingabedatenformate und Geometrie-Datentypen
Zum Verwenden von koordinatenbasierten Funktionen in Athena geben Sie die Daten im WKT-Format ein oder nutzen Sie den Hive JSON SerDe. Sie können auch die in Athena unterstützten Geometrie-Datentypen nutzen.
Eingabedatenformate
Zur Verarbeitung von koordinatenbasierten Abfragen unterstützt Athena Eingabedaten in diesen Datenformaten:
-
WKT (Well-known Text). In Athena wird WKT als
varchar(x)- oderstring-Datentyp dargestellt. -
JSON-kodierte koordinatenbasierte Daten. Zum Analysieren von JSON-Dateien mit koordinatenbasierten Daten und zum Erstellen von Tabellen für diese verwendet Athena den Hive JSON SerDe
. Weitere Informationen zur Verwendung dieses SerDe in Athena finden Sie unter JSON-SerDe-Bibliotheken.
Geometrie-Datentypen
Zur Verarbeitung von koordinatenbasierten Abfragen unterstützt Athena diese speziellen Geometrie-Datentypen:
-
point -
line -
polygon -
multiline -
multipolygon
Unterstützte koordinatenbasierte Funktionen
Weitere Informationen zu den Geodatenfunktionen in Athena-Engine-Version 3 finden Sie unter Geodatenfunktionen