

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Améliorer les performances de Spark avec Amazon S3
<a name="emr-spark-s3-performance"></a>

Amazon EMR propose des fonctionnalités pour aider à optimiser la performance lors de l'utilisation de Spark pour demander, lire et écrire des données enregistrées dans Amazon S3.

[S3 Select](https://aws.amazon.com/blogs/aws/s3-glacier-select/) peut améliorer la performance de requête pour les fichiers CSV et JSON dans certaines applications en « poussant vers le bas » le traitement à Amazon S3.

Le S3-optimized committer EMRFS est une alternative à la [OutputCommitter](https://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapreduce/OutputCommitter.html)classe, qui utilise la fonctionnalité de téléchargement partitionné d'EMRFS pour améliorer les performances lors de l'écriture de fichiers Parquet sur Amazon S3 à l'aide de Spark,, et Datasets. DataFrames

**Topics**
+ [Utilisation de S3 Select avec Spark pour améliorer les performances des requêtes](emr-spark-s3select.md)
+ [EMR Spark MagicCommitProtocol](emr-spark-magic-commit-protocol.md)
+ [Utiliser le validateur EMRFS S3-optimized](emr-spark-s3-optimized-committer.md)
+ [Utiliser le protocole de validation EMRFS S3-optimized](emr-spark-s3-optimized-commit-protocol.md)
+ [Réessayer de demander Amazon S3 avec EMRFS](emr-spark-emrfs-retry.md)