Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Liens vers les guides des meilleures pratiques d'Amazon EMR on EKS sur GitHub
Nous avons élaboré le guide des meilleures pratiques Amazon EMR on EKS
Sécurité
Note
Pour plus d'informations sur la sécurité avec Amazon EMR on EKS, consultez Bonnes pratiques de sécurité pour Amazon EMR on EKS.
Bonnes pratiques en matière de chiffrement :
Gestion de la sécurité du réseau
Utiliser le gestionnaire de AWS secrets pour stocker des secrets
Soumission de tâches PySpark
Soumission de tâches PySpark :
Stockage
Utilisation des volumes EBS :
Utilisation d'Amazon FSx pour les volumes Lustre :
Utilisation des volumes de stockage d'instances :
Intégration de métastore
Utilisation du métastore Hive :
Utiliser AWS Glue :
Débogage
Utilisation du débogage Spark :
Connexion à l'interface utilisateur Spark sur le pod pilote
Utilisation du serveur d'historique Spark auto-hébergé avec Amazon EMR on EKS
Résolution des problèmes liés à Amazon EMR on EKS
Placement des nœuds
Utilisation des sélecteurs de nœuds Kubernetessingle-az et d'autres cas d'utilisation.
Utilisation du placement des nœuds Fargate
Performance
Utilisation de l'allocation dynamique des ressources (DRA)
Par défaut, spark.dynamicAllocation.preallocateExecutors est activé dans Amazon EMR Spark. Lorsque ces spark.dynamicAllocation.initialExecutors paramètres ne spark.dynamicAllocation.minExecutors sont pas définis, Spark peut demander un grand nombre d'exécuteurs au démarrage en fonction du nombre de tâches estimé, même pour de petites charges de travail. Pour éviter un taux de désabonnement excessif des conteneurs, appliquez l'une des approches suivantes :
Définissez
spark.dynamicAllocation.initialExecutorsouspark.dynamicAllocation.minExecutorssur une valeur adaptée à la taille de votre charge de travail.Réglez
spark.dynamicAllocation.preallocateExecutors.maxEstimatedTaskssur une valeur inférieure pour limiter le nombre d'exécuteurs demandés au démarrage.Définissez sur
spark.dynamicAllocation.preallocateExecutorsfalsepour désactiver complètement la préallocation de l'exécuteur.
Bonnes pratiques EKS
Optimisation des coûts
Utilisation d'instances Spot :
En utilisant AWS Outposts
Exécution d'Amazon EMR sur EKS à l'aide de AWS Outposts