Geodaten abfragen - Amazon Athena

Geodaten abfragen

Koordinatenbasierte Daten enthalten Kennungen, die eine geografische Position für ein Objekt angeben. Zu den Beispielen für diese Art von Daten zählen Wetterberichte, Wegbeschreibungen, Tweets mit geografischen Positionen, Filialstandorte und Flugrouten. Koordinatenbasierte Daten spielen eine wichtige Rolle bei Geschäftsanalysen, der Berichterstattung und bei Vorhersagen.

Geografische Kennungen, wie z. B. Längen- und Breitengrade, ermöglichen das Umwandeln von Postanschriften in geografische Koordinaten.

Was ist eine koordinatenbasierte Abfrage?

Koordinatenbasierte Abfragen sind spezielle SQL-Abfragen, die in Athena unterstützt werden. Sie unterscheiden sich von nicht koordinatenbezogenen SQL-Abfragen wie folgt:

  • Verwendung der folgenden spezialisierten Geometrie-Datentypen: pointline, multiline, polygon und multipolygon.

  • Angeben von Beziehungen zwischen Geometrie-Datentypen wie distance, equals, crosses, touches, overlaps, disjoint und anderen.

Mit koordinatenbasierten Abfragen in Athena können Sie diese und ähnliche Operationen ausführen:

  • Ermitteln Sie den Abstand zwischen zwei Punkten.

  • Überprüfen Sie, ob ein Bereich (Polygon) ein weiteres enthält.

  • Feststellen, ob eine Linie eine andere oder ein Polygon berührt oder schneidet.

Um beispielsweise einen Geometriedatentyp point aus Werten des Typs double für die geografischen Koordinaten des Mount Rainier in Athena zu erhalten, verwenden Sie die Geodatenfunktion ST_Point (longitude, latitude) wie im folgenden Beispiel.

ST_Point(-121.7602, 46.8527)

Eingabedatenformate und Geometrie-Datentypen

Zum Verwenden von koordinatenbasierten Funktionen in Athena geben Sie die Daten im WKT-Format ein oder nutzen Sie den Hive JSON SerDe. Sie können auch die in Athena unterstützten Geometrie-Datentypen nutzen.

Eingabedatenformate

Zur Verarbeitung von koordinatenbasierten Abfragen unterstützt Athena Eingabedaten in diesen Datenformaten:

  • WKT (Well-known Text). In Athena wird WKT als varchar(x)- oder string-Datentyp dargestellt.

  • JSON-kodierte koordinatenbasierte Daten. Zum Analysieren von JSON-Dateien mit koordinatenbasierten Daten und zum Erstellen von Tabellen für diese verwendet Athena den Hive JSON SerDe. Weitere Informationen zur Verwendung dieses SerDe in Athena finden Sie unter JSON-SerDe-Bibliotheken.

Geometrie-Datentypen

Zur Verarbeitung von koordinatenbasierten Abfragen unterstützt Athena diese speziellen Geometrie-Datentypen:

  • point

  • line

  • polygon

  • multiline

  • multipolygon

Unterstützte koordinatenbasierte Funktionen

Weitere Informationen zu den Geodatenfunktionen in Athena-Engine-Version 3 finden Sie unter Geodatenfunktionen in der Trino-Dokumentation.