Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Apache Spark in Amazon Athena verwenden
Amazon Athena vereinfacht die interaktive Ausführung von Datenanalysen und -erkundungen mithilfe von Apache Spark, ohne dass Sie Ressourcen planen, konfigurieren oder verwalten müssen. Das Ausführen von Apache-Spark-Anwendungen auf Athena bedeutet, dass Spark-Code zur Verarbeitung übermittelt und die Ergebnisse direkt empfangen werden, ohne dass eine zusätzliche Konfiguration erforderlich ist. Apache Spark auf Amazon Athena ist Serverless und bietet eine automatische, bedarfsgerechte Skalierung, die sofortige Rechenleistung für sich ändernde Daten-Volumes und Verarbeitungsanforderungen bereitstellt.
In der Release-Version PySpark Engine-Version 3 können Sie die vereinfachte Notebook-Oberfläche in der Amazon Athena Athena-Konsole verwenden, um Apache Spark-Anwendungen mit Python oder Athena Notebook zu entwickeln. APIs
In der Release-Version Apache Spark Version 3.5 können Sie Spark-Code von Amazon SageMaker Unified Studio-Notebooks oder Ihren bevorzugten Spark Connect-kompatiblen Clients ausführen.
Amazon Athena bietet die folgenden Features:
-
Konsolennutzung — Reichen Sie Ihre Spark-Anwendungen von der Amazon Athena Athena-Konsole aus ein (nur Pyspark Enginer Version 3).
-
Scripting – Erstellen und debuggen Sie schnell und interaktiv Apache-Spark-Anwendungen in Python.
-
Dynamische Skalierung – Amazon Athena bestimmt automatisch die Rechen- und Arbeitsspeicherressourcen, die zum Ausführen eines Auftrags erforderlich sind, und skaliert diese Ressourcen fortlaufend entsprechend bis zu den von Ihnen angegebenen Höchstwerten. Diese dynamische Skalierung reduziert die Kosten, ohne die Geschwindigkeit zu beeinträchtigen.
-
Notebook-Erfahrung — Verwenden Sie die Amazon SageMaker AI Unified Studio-Notebooks, um Berechnungen über eine vertraute Oberfläche zu erstellen, zu bearbeiten und auszuführen. In der Pyspark-Engine-Version 3 können Sie Athena-Notebooks in der Konsole verwenden, die mit Jupyter-Notebooks kompatibel sind und eine Liste von Zellen enthalten, die der Reihe nach als Berechnungen ausgeführt werden. Zelleninhalte können Code, Text, Markdown, Mathematik, Diagramme und Multimedia enthalten.
Weitere Informationen finden Sie unter Run Spark SQL on Amazon Athena Spark