Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Links zu Best-Practice-Leitfäden für Amazon EMR on EKS unter GitHub
Wir haben den Amazon EMR on EKS Best Practices Guide
Sicherheit
Anmerkung
Weitere Informationen zur Sicherheit mit Amazon EMR in EKS finden Sie unter Bewährte Methoden für Sicherheit in Amazon EMR in EKS.
Bewährte Methoden zur Verschlüsselung:
Unter Netzwerksicherheit verwalten
Verwenden des AWS Secrets Managers zum Speichern von Geheimnissen
Einreichung einer Pyspark-Aufgabe
Pyspark-Aufgaben-Einreichung:
Speicher
Verwendung von EBS-Volumes:
Verwenden von Amazon FSx for Lustre-Volumes:
Verwenden von Instance-Speicher-Volumes:
Metastore-Integration
Verwenden von Hive Metastore:
Verwenden von AWS Glue:
Debuggen
Verwendung von Spark-Debugging:
Verbindung zur Spark-Benutzeroberfläche auf dem Treiber-Pod herstellen.
So verwenden Sie den selbst gehosteten Spark-Verlaufsserver mit Amazon EMR in EKS.
Beheben von Problemen in Amazon EMR in EKS
Knotenplatzierung
Verwendung von Kubernetes-Knotenselektorensingle-az und andere Anwendungsfälle.
Verwenden der Fargate-Knotenplatzierung
Leistung
Verwenden von Dynamic Resource Allocation (DRA)
spark.dynamicAllocation.preallocateExecutorsIst standardmäßig in Amazon EMR Spark aktiviert. Wenn spark.dynamicAllocation.initialExecutors und nicht gesetzt spark.dynamicAllocation.minExecutors sind, fordert Spark beim Start möglicherweise eine große Anzahl von Executoren auf der Grundlage der geschätzten Anzahl von Aufgaben an, selbst bei kleinen Workloads. Verwenden Sie einen der folgenden Ansätze, um eine übermäßige Abwanderung von Containern zu vermeiden:
Stellen Sie
spark.dynamicAllocation.initialExecutorsoderspark.dynamicAllocation.minExecutorsauf einen Wert ein, der Ihrer Workload-Größe entspricht.Legen Sie
spark.dynamicAllocation.preallocateExecutors.maxEstimatedTaskseinen niedrigeren Wert fest, um die Anzahl der beim Start angeforderten Executoren zu begrenzen.Wird
spark.dynamicAllocation.preallocateExecutorsauf gesetzt,falseum die Vorbelegung von Executoren vollständig zu deaktivieren.
Bewährte EKS-Methoden
Kostenoptimierung
Verwendung von Spot Instances:
Benutzen AWS Outposts
Amazon EMR auf EKS ausführen mit AWS Outposts