Verfügbare Datenquellenkonnektoren - Amazon Athena

Verfügbare Datenquellenkonnektoren

In diesem Abschnitt werden vorab erstellte Athena-Datenquellen-Konnektors aufgeführt, mit denen Sie zahlreiche Datenquellen außerhalb von Amazon S3 abfragen können. Um einen Konnektor in Ihren Athena-Abfragen zu verwenden, konfigurieren Sie ihn und stellen ihn in Ihrem Konto bereit.

Überlegungen und Einschränkungen

  • Für einige vorgefertigte Konnektors müssen Sie eine VPC und eine Sicherheitsgruppe erstellen, bevor Sie den Konnektor verwenden können. Informationen zum Erstellen eigener Subnetze finden Sie unter Erstellen einer VPC für einen Datenquellen-Connector oder eine AWS Glue-Verbindung.

  • Um das Athena-Federated-Query-Feature mit AWS Secrets Manager zu verwenden, müssen Sie einen privaten Amazon-VPC-Endpunkt für Secrets Manager konfigurieren. Weitere Informationen finden Sie unter Erstellen eines privaten Secrets-Manager-VPC-Endpunkts im Benutzerhandbuch für AWS Secrets Manager.

  • Bei Konnektoren, die kein Prädikat-Pushdown unterstützen, dauert die Ausführung von Abfragen, die ein Prädikat enthalten, länger. Bei kleinen Datensätzen werden nur sehr wenige Daten gescannt, und Abfragen dauern durchschnittlich etwa 2 Minuten. Bei großen Datensätzen kann es jedoch zu einer Zeitüberschreitung bei vielen Abfragen kommen.

  • Einige föderierte Datenquellen verwenden Terminologie, um auf Datenobjekte zu verweisen, die sich von Athena unterscheiden. Weitere Informationen finden Sie unter Grunlegendes über Qualifikatoren für verbundene Tabellennamen.

  • Wir aktualisieren unsere Konnektoren regelmäßig auf der Grundlage von Upgrades vom Datenbank- oder Datenquellenanbieter. Wir unterstützen keine Datenquellen, deren Support ausgelaufen ist.

  • Bei Konnektoren, die beim Auflisten von Tabellen keine Paginierung unterstützen, kann es beim Webservice zu einem Timeout kommen, wenn Ihre Datenbank viele Tabellen und Metadaten enthält. Die folgenden Konnektoren bieten Unterstützung für die Paginierung von Auflistungstabellen:

    • DocumentDB

    • DynamoDB

    • MySQL

    • OpenSearch

    • Oracle

    • PostgreSQL

    • Redshift

    • SQL Server

Case-Resolver-Modi im Verbund-SDK

Das Verbund-SDK unterstützt die folgenden standardisierten Case-Resolver-Modi für Schema- und Tabellennamen:

  • NONE – Ändert die Groß- und Kleinschreibung der angegebenen Schema- und Tabellennamen nicht.

  • LOWER – Kleinschreibung aller angegebenen Schema- und Tabellennamen.

  • UPPER – Großschreibung aller angegebenen Schema- und Tabellennamen.

  • ANNOTATION – Dieser Modus wird nur aus Gründen der Abwärtskompatibilität beibehalten und ausschließlich von vorhandenen Snowflake- und SAP HANA-Konnektoren unterstützt.

  • CASE_INSENSITIVE_SEARCH – Führt Suchen nach Schema- und Tabellennamen ohne Berücksichtigung der Groß- und Kleinschreibung durch.

Connector-Unterstützung für Case-Resolver-Modi

Basismodus-Support

Alle JDBC-Konnektoren unterstützen die folgenden Basismodi:

  • NONE

  • LOWER

  • UPPER

Annotationsmodus-Support

Nur die folgenden Konnektoren unterstützen den ANNOTATION-Modus:

  • Snowflake

  • SAP HANA

Anmerkung

Es wird empfohlen, CASE_INSENSITIVE_SEARCH anstelle von ANNOTATION zu verwenden.

Unterstützung für die Suche ohne Berücksichtigung der Groß-/Kleinschreibung

Die folgenden Konnektoren unterstützen CASE_INSENSITIVE_SEARCH:

  • DataLake Gen2

  • Snowflake

  • Oracle

  • Synapse

  • MySQL

  • PostgreSQL

  • Redshift

  • ClickHouse

  • SQL Server

  • DB2

Einschränkungen beim Case-Resolver

Beachten Sie bei der Verwendung von Fallauflösungsmodi die folgenden Einschränkungen:

  • Wenn Sie LOWER-Modus verwenden, müssen Ihr Schemaname und alle Tabellen innerhalb des Schemas in Kleinbuchstaben geschrieben sein.

  • Wenn Sie UPPER-Modus verwenden, müssen Ihr Schemaname und alle Tabellen innerhalb des Schemas in Großbuchstaben geschrieben sein.

  • Bei Verwendung von „.“ CASE_INSENSITIVE_SEARCH:

    • Schema-Namen müssen eindeutig sein

    • Tabellennamen innerhalb eines Schemas müssen eindeutig sein (Sie können beispielsweise nicht gleichzeitig „Apple“ und „APPLE“ haben)

  • Einschränkungen der Glue-Integration:

    • Glue unterstützt nur Namen in Kleinbuchstaben

    • Nur die NONE- oder LOWER-Modi funktionieren, wenn Sie Ihre Lambda-Funktion bei GlueDataCatalog/LakeFormation registrieren

Zusätzliche Informationen

Anmerkung

Der AthenaJdbcConnector (neueste Version  2022.4.1) wurde als veraltet markiert. Verwenden Sie stattdessen einen datenbankspezifischen Konnektor wie den für MySQL, Redshift oder PostgreSQL.