Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Enlaces a las guías de prácticas recomendadas de Amazon EMR sobre EKS en GitHub
Hemos creado la Guía de prácticas recomendadas de Amazon EMR en EKS
Seguridad
nota
Para obtener más información sobre la seguridad con Amazon EMR en EKS, consulte Prácticas recomendadas de seguridad de Amazon EMR en EKS.
Prácticas recomendadas de cifrado:
En Administración de la seguridad de la red
Uso del administrador de AWS secretos para almacenar secretos
Envío de trabajos de PySpark
Envío de trabajos de PySpark:
Almacenamiento
Uso de volúmenes de EBS:
Uso de volúmenes de Amazon FSx for Lustre:
Uso de volúmenes de almacenes de instancias:
Integración con metaalmacenes
Uso de metaalmacenes de Hive:
Uso de AWS Glue:
Debugging
Uso de la depuración de Spark:
Conexión a la interfaz de usuario de Spark en el pod controlador.
Cómo utilizar el servidor de historial Spark autoalojado con Amazon EMR en EKS
Solución de problemas de Amazon EMR en EKS
Colocación de nodos
Uso de selectores de nodos de Kubernetessingle-az y otros casos de uso.
Uso de la colocación de nodos de Fargate
Desempeño
Uso de la asignación dinámica de recursos (DRA)
De forma predeterminada, spark.dynamicAllocation.preallocateExecutors está habilitada en Amazon EMR Spark. Cuando spark.dynamicAllocation.minExecutors están configurados spark.dynamicAllocation.initialExecutors y no están configurados, es posible que Spark solicite un gran número de ejecutores al inicio en función del número estimado de tareas, incluso para cargas de trabajo pequeñas. Para evitar una rotación excesiva de contenedores, usa uno de los siguientes enfoques:
Establezca
spark.dynamicAllocation.initialExecutorsospark.dynamicAllocation.minExecutorsen un valor adecuado para el tamaño de su carga de trabajo.spark.dynamicAllocation.preallocateExecutors.maxEstimatedTasksConfigúrelo en un valor inferior para limitar el número de ejecutores solicitados al inicio.spark.dynamicAllocation.preallocateExecutorsConfigúrelofalsepara deshabilitar por completo la preasignación del ejecutor.
Prácticas recomendadas de EKS
Optimización de costos
Uso de instancias de spot:
Usando AWS Outposts
Ejecución de Amazon EMR en EKS mediante AWS Outposts