Utilisation de la console Athena pour se connecter à une source de données - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de la console Athena pour se connecter à une source de données

Vous pouvez utiliser la console Athena pour créer et configurer une connexion à une source de données.

Pour créer une connexion à une source de données
  1. Ouvrez la console à l'adresse https://console.aws.amazon.com/athena/.

  2. Si le panneau de navigation de la console n'est pas visible, choisissez le menu d'extension sur la gauche.

    Choisissez le menu d'expansion.
  3. Dans le panneau de navigation, sélectionnez Sources de données et catalogues.

  4. Sur la page Sources de données et catalogues, sélectionnez Créer une source de données.

  5. Pour Choose a data source (Sélectionnez une source de données), choisissez la source de données qu'Athena doit interroger, en tenant compte des directives suivantes :

    • Choisissez une option de connexion qui correspond à votre source de données. Athena dispose de connecteurs de source de données prédéfinis que vous pouvez configurer pour des sources comme MySQL, Amazon DocumentDB et PostgreSQL.

    • Choisissez S3 - AWS Glue Data Catalog si vous souhaitez interroger des données dans Simple Storage Service (Amazon S3) et que vous n'utilisez pas un métastore Apache Hive ou l'une des autres options de source de données de requête fédérée de cette page. Athena utilise le AWS Glue Data Catalog pour stocker les métadonnées et les informations de schéma pour les sources de données Simple Storage Service (Amazon S3). Il s'agit de l'option par défaut (non fédérée). Pour de plus amples informations, veuillez consulter AWS Glue Data CatalogÀ utiliser pour vous connecter à vos données. Pour connaître les étapes associées à l’utilisation de ce flux de travail, consultez Enregistrement et utilisation des catalogues de données dans Athena.

    • Choisissez S3 - Apache Hive metastore (métastore Apache Hive) pour interroger les jeux de données dans Simple Storage Service (Amazon S3) qui utilisent un métastore Apache Hive. Pour plus d’informations sur cette option, consultez Connexion d’Athena à un metastore Apache Hive.

    • Choisissez Custom or shared connector (Connecteur personnalisé ou partagé) si vous souhaitez créer votre propre connecteur de source de données à utiliser avec Athena. Pour plus d'informations sur l'écriture d'un connecteur de source de données , consultez Développement d’un connecteur de source de données à l’aide du kit SDK Athena Query Federation.

  6. Choisissez Suivant.

  7. Sur la page Saisir les détails de la source de données, dans Nom de la source de données, utilisez le nom généré automatiquement ou saisissez un nom unique que vous souhaitez utiliser dans vos instructions SQL lorsque vous interrogez la source de données à partir d’Athena. Le nom peut contenir jusqu'à 127 caractères et doit être unique dans votre compte. Il ne peut pas être modifié après sa création. Les caractères valides sont a-z, A-Z, 0–9, _ (trait de soulignement), @ (arobase) et - (trait d'union). Les noms awsdatacatalog, hive, jmx et system sont réservés par Athena et ne peuvent pas être utilisés pour les noms de source de données.

  8. Si la source de données que vous choisissez s'intègre aux AWS Glue connexions.

    1. Dans Informations de connexion à AWS Glue, saisissez les informations requises. Une connexion contient les propriétés requises pour se connecter à une source de données particulière Les propriétés requises varient en fonction du type de connexion. Pour plus d’informations sur les propriétés associées à votre connecteur, consultez Connecteurs de source de données disponibles. Pour plus d’informations sur les propriétés de connexion supplémentaires, consultez AWS Glue connection properties dans le Guide d’utilisation d’AWS Glue.

      Note
      • Lorsque vous mettez à jour les propriétés de connexion Glue, le connecteur Lambda doit être redémarré pour obtenir les propriétés mises à jour. Pour ce faire, modifiez les propriétés de l’environnement et enregistrez-le sans réellement apporter de changements.

      • Lorsque vous mettez à jour une connexion Glue, les propriétés suivantes ne sont pas automatiquement mises à jour dans la fonction Lambda correspondante. Vous devez mettre à jour manuellement votre fonction Lambda pour ces propriétés.

        • Configuration du VPC Lambda : security_group_ids, subnet_ids

        • Rôle d’exécution Lambda : spill_bucket, secret_name, spill_kms_key_id

    2. Dans Rôle IAM d’exécution Lambda choisissez l’une des options suivantes :

      • Créer et utiliser un nouveau rôle d'exécution — (par défaut) Athena crée un rôle d'exécution qu'elle utilisera ensuite pour accéder aux ressources en votre AWS Lambda nom. Athena a besoin de ce rôle pour créer votre source de données fédérée.

      • Utiliser un rôle d’exécution existant : utilisez cette option pour choisir un rôle d’exécution existant. Dans cette option, choisissez le rôle d’exécution que vous souhaitez utiliser dans la liste déroulante Rôle d’exécution.

  9. Si la source de données que vous sélectionnez ne s’intègre pas aux connexions AWS Glue.

    1. Pour Lambda Function (fonction Lambda), choisissez Create Lambda Function (Créer une fonction Lambda). La page de fonctions du connecteur que vous avez choisi s'ouvre dans la AWS Lambda console. La page contient des informations détaillées sur le connecteur.

    2. Sous Application settings (Paramètres d'application), lisez attentivement la description de chaque paramètre d'application, puis saisissez les valeurs qui correspondent à vos besoins.

      Les paramètres de l'application que vous voyez varient en fonction du connecteur de votre source de données. Les paramètres minimaux requis sont les suivants :

      • AthenaCatalogName— Nom, en minuscules, de la fonction Lambda qui indique la source de données qu'elle cible, par exemple. cloudwatchlogs

      • SpillBucket— Un compartiment Amazon S3 dans votre compte pour stocker les données qui dépassent les limites de taille de réponse de la fonction Lambda.

        Note

        Les données déversées ne sont pas réutilisées lors des exécutions suivantes et peuvent être supprimées en toute sécurité. Athena ne supprime pas ces données pour vous. Pour gérer ces objets, envisagez d'ajouter une politique de cycle de vie des objets qui supprime les anciennes données de votre compartiment de déversement Simple Storage Service (Amazon S3). Pour plus d’informations, consultez Managing your storage lifecycle dans le Guide d’utilisation d’Amazon S3.

    3. Sélectionnez I acknowledge that this app creates custom IAM roles and resource policies (Je reconnais que cette application crée des politiques de ressources et rôles IAM personnalisés). Pour de plus amples informations, veuillez cliquer sur le lien Info.

    4. Choisissez Déployer. Lorsque le déploiement est terminé, la fonction Lambda apparaît dans la section Resources (Ressources) dans la console Lambda.

      Une fois que vous avez déployé le connecteur de source de données sur votre compte, vous pouvez y connecter Athena.

    5. Revenez à la page Enter data sources details (Saisir les détails des sources de données) de la console Athena.

    6. Dans la section Connection details (Détails de connexion), choisissez l'icône actualiser à côté de la zone de recherche Select or enter a Lambda function (Sélectionner ou saisir une fonction Lambda.

    7. Choisissez le nom de la fonction que vous venez de créer dans la console Lambda. L'ARN de la fonction Lambda s'affiche.

  10. (Facultatif) Pour Tags (Identifications), ajoutez des paires clé-valeur à associer à cette source de données. Pour en savoir plus sur les identifications, consultez Balisage des ressources Athena.

  11. Choisissez Suivant.

  12. Sur la page Vérifier et créer, vérifiez les détails de la source de données. Pour effectuer des changements, sélectionnez Modifier.

  13. Lisez les informations contenues dans Athena créera des ressources dans votre compte. Si vous êtes d’accord, sélectionnez Je reconnais qu’Athena créera des ressources en mon nom.

  14. Choisissez Create data source. Athena créera les ressources suivantes pour vous.

    • Rôle IAM d’exécution Lambda

    • AWS Glueconnexion (uniquement si la source de données est compatible avec AWS Glue Connections)

    • Fonction Lambda

La section Data source details (Détails de source de données) de la page de votre source de données affiche des informations sur votre nouveau connecteur. Vous pouvez maintenant utiliser le connecteur dans vos requêtes Athena.

Pour de plus amples informations sur l'utilisation de connecteurs de données dans les requêtes, consultez Exécution de requêtes fédérées.