Enregistrement de votre connexion en tant que Catalogue de données Glue - Amazon Athena

Enregistrement de votre connexion en tant que Catalogue de données Glue

Après avoir créé votre source de données, vous pouvez utiliser la console Athena pour enregistrer votre connexion en tant que Catalogue de données Glue. Une fois enregistré, vous pouvez gérer votre catalogue de données fédéré et activer le contrôle d’accès précis à l’aide de Lake Formation. Pour plus d’informations, consultez Creating a federated catalog.

Vous pouvez enregistrer les connecteurs suivants pour les intégrer à AWS Glue à des fins de contrôle d’accès précis.

  • Redshift

  • BigQuery

  • DynamoDB (version préliminaire)

  • Snowflake (version préliminaire)

  • MySQL

  • PostgreSQL

  • AWS CMDB

  • Timestream

  • Stockage Azure Data Lake

  • Azure Synapse

  • IBM Db2

  • IBM Db2 AS/400 (Db2 iSeries)

  • DocumentDB

  • Google Cloud Storage

  • HBase

  • OpenSearch

  • Oracle

  • SAP HANA

  • SQL Server

  • TPC-DS

  • Cloudera Hive

  • Cloudwatch

  • Cloudwatch Metrics

  • Teradata

  • Vertica

Prérequis

Avant de commencer, vous devez remplir les conditions préalables suivantes.

  • Assurez-vous de disposer des rôles et autorisations nécessaires pour enregistrer des emplacements. Pour plus d’informations, consultez Requirements for roles dans le Guide de développement d’AWS Lake Formation.

  • Assurez-vous de disposer des rôles Lake Formation requis. Pour plus d’informations, consultez Prerequisites for connecting the Data Catalog to external data sources dans le Guide de développement d’AWS Lake Formation.

  • Le rôle que vous enregistrez dans Glue doit disposer des autorisations répertoriées dans l’exemple suivant.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix/*", "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "arn:aws:lambda:us-east-1:111122223333:function:lambda_function_name" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:us-east-1:111122223333:connection/<connection_name>", "arn:aws:glue:us-east-1:111122223333:catalog" ] } ] }
  • Vous êtes responsable de la détermination et de la gestion de l’accès approprié aux données. Pour des contrôles d’accès précis sur les requêtes fédérées, il est recommandé d’utiliser la politique gérée AmazonAthenaFullAccess. Si vous souhaitez utiliser votre propre politique, vous devez vous assurer que les utilisateurs exécutant des requêtes fédérées n’ont pas accès aux ressources suivantes.

    • lambda:InvokeFunction sur le connecteur Lambda spécifié dans la connexion Glue

    • Accès à l’emplacement du compartiment de déversement dans IAM

    • Accès à la connexion Glue associée à votre catalogue fédéré

    • Rôle Lake Formation dans IAM

Enregistrement de votre connexion à l’aide de la console

Pour enregistrer votre connexion en tant que Catalogue de données Glue
  1. Ouvrez la console Athena à l’adresse https://console.aws.amazon.com/athena/.

  2. Dans le panneau de navigation, sélectionnez Sources de données et catalogues.

  3. Dans la liste Sources de données, choisissez la source de données que vous avez créée pour ouvrir la page Détails de la source de données.

  4. Choisissez Mise en route avec AWS Lake Formation.

    Note

    Après avoir choisi cette option, vous devrez gérer vous-même votre fonction Lambda. Athena ne supprimera pas votre fonction Lambda.

  5. Dans Nom du catalogue de données, indiquez un nom unique pour votre catalogue.

  6. Choisissez le Rôle IAM de Lake Formation qui accorde à Lake Formation l’autorisation d’invoquer la fonction Lambda. Assurez-vous que le rôle dispose des autorisations illustrées dans l’exemple.

  7. Dans la zone de texte, tapez confirm pour supprimer la source de données Athena et remplacez-la par un enregistrement du Catalogue de données Glue.

    Note

    Cette action supprimera votre source de données Athena et créera un nouveau Catalogue de données Glue à la place. Une fois ce processus terminé, vous devrez peut-être mettre à jour les requêtes qui accèdent à la source de données afin qu’elles se réfèrent plutôt au Catalogue de données Glue que vous venez de créer.

  8. Sélectionnez Créer un catalogue et accéder à Lake Formation. Cette action ouvre la console Lake Formation, dans laquelle vous pouvez gérer le catalogue et accorder des autorisations aux utilisateurs sur les catalogues, les bases de données et les tables.