Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Enregistrement de catalogues de données Redshift dans Athena
Athena peut lire et écrire des données stockées dans des espaces de noms sans serveur ou des clusters Redshift enregistrés dans le AWS Glue Data Catalog. Ces fonctionnalités fonctionnent en tandem avec AWS Lake Formation, qui offre une sécurité et une gouvernance centralisées. Cela permet de garantir un accès aux données géré de manière cohérente sur les différents moteurs de requête et de maintenir des contrôles d’accès précis pour les données Redshift partagées.
Considérations et restrictions
-
Vues matérialisées : les vues matérialisées Amazon Redshift peuvent être interrogées à partir d’Athena, mais la création de vues matérialisées à l’aide d’Athena ou de Spark n’est pas prise en charge.
-
Les opérations DDL (y compris le paramétrage de la configuration et des opérations du AWS Glue Data Catalog sur les tables de stockage gérées par Amazon Redshift) ne sont pas prises en charge.
Prérequis
Avant de pouvoir interroger un catalogue de données AWS Glue à partir d’Athena, exécutez les tâches suivantes :
-
Créez et enregistrez un cluster ou un espace de noms sans serveur Amazon Redshift dans le AWS Glue Data Catalog. Pour plus d’informations, consultez Registering a cluster to the AWS Glue Data Catalog ou Registering namespaces to the AWS Glue Data Catalog dans le Guide de gestion d’Amazon Redshift.
-
Créez un catalogue de données dans AWS Lake Formation à partir de l’espace de noms enregistré. Pour plus d’informations, consultez Creating Amazon Redshift federated catalogs dans le Guide de développement d’AWS Lake Formation.
-
(Facultatif) Utilisez Lake Formation pour définir des contrôles d’accès précis dans le catalogue. Pour plus d’informations, consultez Bringing your data into the AWS Glue Data Catalog dans le Guide de développement d’AWS Lake Formation.
Enregistrement d’un catalogue de données Redshift à l’aide de la console Athena
Pour enregistrer un catalogue de données Redshift à l’aide de la console Athena, effectuez les étapes suivantes.
-
Ouvrez la console Athena à l’adresse https://console.aws.amazon.com/athena/
. -
Dans le panneau de navigation, sélectionnez Sources de données et catalogues.
-
Sur la page Sources de données et catalogues, sélectionnez Créer une source de données.
-
Dans Choisir une source de données, sélectionnez Amazon S3 – AWS Glue Data Catalog.
-
Dans la section AWS Glue Data Catalog, dans Compte de source de données, sélectionnez AWS Glue Data Catalog dans ce compte.
-
Dans Créer une table ou enregistrer un catalogue, sélectionnez Enregistrer un nouveau catalogue AWS Glue.
-
Dans la section Détails de la source de données, dans Nom de la source de données, saisissez le nom que vous souhaitez utiliser pour spécifier la source de données dans vos requêtes SQL ou utilisez le nom par défaut généré.
-
Dans Catalogue, sélectionnez Parcourir pour rechercher une liste de catalogues AWS Glue dans le même compte. Si vous ne voyez aucun catalogue existant, créez-en un dans la console AWS Glue
. -
Dans la boîte de dialogue Parcourir les catalogues AWS Glue, sélectionnez le catalogue que vous souhaitez utiliser, puis sélectionnez Choisir.
-
(Facultatif) Dans Identifications, saisissez les paires clé-valeur que vous souhaitez associer à la source de données.
-
Choisissez Suivant.
-
Sur la page Vérifier et créer, vérifiez que les informations que vous avez saisies sont correctes, puis sélectionnez Créer une source de données.