Optimisation des requêtes grâce à l’indexation et au filtrage des partitions AWS Glue
Lors de l'interrogation de tables partitionnées, Athena récupère et filtre les partitions de table disponibles vers le sous-ensemble correspondant à votre requête. À mesure que de nouvelles données et partitions sont ajoutées, il faut plus de temps pour traiter les partitions et l'exécution des requêtes peut augmenter. Si vous disposez d'une table avec un grand nombre de partitions qui croît au fil du temps, envisagez d'utiliser indexation et filtrage des partitions AWS Glue. L'indexation des partitions permet à Athena d'optimiser le traitement des partitions et d'améliorer les performances des requêtes sur les tables fortement partitionnées. La configuration du filtrage de partition dans les propriétés d'une table s'effectue en deux étapes :
-
Création d'un index de partition dans AWS Glue.
-
Activation du filtrage des partitions pour la table.
Création d'un index de partition
Pour connaître les étapes de création d'un index de partition dans AWS Glue, consultez la section Utilisation des index de partition dans le Guide du développeur AWS Glue. Pour connaître les limites des index de partition dans AWS Glue, consultez la section À propos des index de partition sur cette page.
Activation du filtrage de partition
Pour activer le filtrage des partitions pour la table, vous devez définir une nouvelle propriété de table dans AWS Glue. Pour savoir comment définir les propriétés de la table dans AWS Glue, consultez la page Configuration de la projection de partition. Lorsque vous modifiez les détails du tableau dans AWS Glue, ajoutez la paire clé-valeur suivante à la section Propriétés de table :
-
Pour Key (Clé), ajoutez
partition_filtering.enabled -
Pour Value (Valeur), ajoutez
true
Vous pouvez désactiver le filtrage de partition sur cette table à tout moment en définissant la valeur partition_filtering.enabled sur false.
Une fois que vous avez terminé les étapes ci-dessus, vous pouvez revenir à la console Athena pour interroger les données.
Pour de plus amples informations sur l'utilisation de l'indexation et du filtrage des partitions, consultezAméliorer les performances des requêtes Amazon Athena en utilisant les index de partitionAWS Glue Data Catalog