

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Collegamenti ad Amazon EMR su EKS, guide sulle best practice su GitHub
<a name="best-practices"></a>

Abbiamo creato la [Amazon EMR on EKS Best Practices Guide](https://aws.github.io/aws-emr-containers-best-practices/) utilizzando la collaborazione della community open source in modo da poter iterare rapidamente e fornire consigli sugli aspetti della creazione e della gestione di un cluster virtuale. È preferibile utilizzare la [Guida sulle procedure consigliate per Amazon EMR su EKS](https://aws.github.io/aws-emr-containers-best-practices/) per le sezioni. Scegli i link in ogni sezione per accedere al GitHub sito.

## Sicurezza
<a name="security"></a>

**Nota**  
Per ulteriori informazioni sulla sicurezza con Amazon EMR su EKS, consulta [Best practice di sicurezza per Amazon EMR su EKS](security-best-practices.md).

[Best practice per la crittografia](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/encryption/): come utilizzare la crittografia per dati a riposo e in transito.

[Gestione della sicurezza della rete](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/network-security/) descrive come configurare gruppi di sicurezza per i pod per Amazon EMR su EKS mentre ti connetti a origini dati ospitate in Servizi AWS , ad esempio Amazon RDS e Amazon Redshift.

[Utilizzo del gestore AWS dei segreti per archiviare i segreti](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/encryption/).

## Invio di processi Pyspark
<a name="pyspark-job-submission"></a>

[Invio di processi Pyspark:](https://aws.github.io/aws-emr-containers-best-practices/submit-applications/docs/spark/pyspark/) specifica diverse modalità di creazione pacchetti per applicazioni PySpark con formati di pacchetti come zip, egg, wheel e pex.

## Archiviazione
<a name="storage"></a>

[Utilizzo di volumi EBS:](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/ebs/) come utilizzare il provisioning statico e dinamico per i processi che richiedono volumi EBS.

[Utilizzo dei volumi Amazon FSx for Lustre:](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/fsx-lustre/) come utilizzare il provisioning statico e dinamico per lavori che richiedono volumi Amazon FSx for Lustre.

[Utilizzo di volumi di archivio dell'istanza:](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/instance-store/) come utilizzare i volumi di archivio dell'istanza per l'elaborazione di processi.

## Integrazione metastore
<a name="metastore-integration"></a>

[Utilizzo del metastore Hive:](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/hive-metastore/) offre diversi metodi per utilizzare il metastore Hive.

[Utilizzo di AWS Glue:](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/hive-metastore/) offre diversi modi per configurare il catalogo AWS Glue.

## Debug
<a name="debugging"></a>

[Utilizzo del debug Spark:](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/change-log-level/) come modificare il livello di log.

[Connessione all'interfaccia utente Spark sul pod driver](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/connect-spark-ui/).

[Come utilizzare il server di cronologia Spark in hosting autonomo con Amazon EMR su EKS](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/self-hosted-shs/).

## Soluzione dei problemi di Amazon EMR su EKS
<a name="troubleshooting"></a>

[Soluzione dei problemi](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/where-to-look-for-spark-logs/).

## Posizionamento dei nodi
<a name="node-placement"></a>

[Utilizzo dei selettori dei nodi Kubernetes](https://aws.github.io/aws-emr-containers-best-practices/node-placement/docs/eks-node-placement/) per `single-az` e altri casi d'uso.

[Utilizzo del posizionamento dei nodi Fargate](https://aws.github.io/aws-emr-containers-best-practices/node-placement/docs/fargate-node-placement/).

## Performance
<a name="performance"></a>

[Utilizzo dell'allocazione dinamica delle risorse (DRA)](https://aws.github.io/aws-emr-containers-best-practices/performance/docs/dra/).

Per impostazione predefinita, `spark.dynamicAllocation.preallocateExecutors` è abilitato in Amazon EMR Spark. Se `spark.dynamicAllocation.initialExecutors` e non `spark.dynamicAllocation.minExecutors` sono impostati, Spark può richiedere un gran numero di esecutori all'avvio in base al numero stimato di attività, anche per piccoli carichi di lavoro. Per evitare un'eccessiva apertura dei container, utilizza uno dei seguenti approcci:
+ Imposta `spark.dynamicAllocation.initialExecutors` o `spark.dynamicAllocation.minExecutors` su un valore appropriato per le dimensioni del carico di lavoro.
+ `spark.dynamicAllocation.preallocateExecutors.maxEstimatedTasks`Imposta su un valore inferiore per limitare il numero di esecutori richiesti all'avvio.
+ Impostato `spark.dynamicAllocation.preallocateExecutors` per `false` disabilitare completamente la preallocazione degli esecutori.

[Procedure consigliate per EKS](https://aws.github.io/aws-emr-containers-best-practices/best-practices-and-recommendations/eks-best-practices/) per il plug-in Amazon VPC Container Network Interface (CNI), Cluster Autoscaler e Core DNS.

## Ottimizzazione dei costi
<a name="cost-optimization"></a>

[Utilizzo di istanze spot:](https://aws.github.io/aws-emr-containers-best-practices/cost-optimization/docs/cost-optimization/) procedure consigliate per istanze spot Amazon EC2 e modalità di utilizzo della funzione di disattivazione dei nodi Spark.

## Usando AWS Outposts
<a name="using-outposts"></a>

[Esecuzione di Amazon EMR su EKS utilizzando AWS Outposts](https://aws.github.io/aws-emr-containers-best-practices/outposts/emr-containers-on-outposts/)