Connexions aux sources de données de l’extension SQL - Amazon SageMaker AI

Connexions aux sources de données de l’extension SQL

Avant d’utiliser l’extension SQL dans les blocs-notes JupyterLab, les administrateurs ou les utilisateurs doivent créer des connexions AWS Glue à leurs sources de données. L’extension SQL permet de se connecter à des sources de données telles qu’Amazon Redshift, Amazon Athena ou Snowflake.

Pour configurer les connexions, les administrateurs doivent d’abord s’assurer que leur configuration réseau autorise la communication entre Studio et les sources de données, puis accorder les autorisations IAM nécessaires pour permettre à Studio d’accéder aux sources de données. Pour en savoir plus sur la manière dont les administrateurs peuvent configurer la mise en réseau, consultez Configuration de l’accès réseau entre Studio et les sources de données (pour les administrateurs). Pour en savoir plus sur les politiques à configurer, consultez Configuration des autorisations IAM pour accéder aux sources de données (pour les administrateurs). Une fois les connexions configurées, les scientifiques des données peuvent utiliser l’extension SQL dans leurs blocs-notes JupyterLab pour parcourir et interroger les sources de données connectées.

Note

Nous vous recommandons de stocker vos informations d’identification et d’accès à la base de données en tant que secret dans Secrets Manager. Pour découvrir comment créer des secrets pour stocker les informations d’identification et d’accès à Amazon Redshift ou Snowflake, consultez Création de secrets pour les informations d’identification et d’accès à la base de données dans Secrets Manager.

Cette section explique comment configurer une connexion AWS Glue et répertorie les autorisations IAM requises pour que l’application Studio JupyterLab puisse accéder aux données via la connexion.

Note

Amazon SageMaker Assets intègre Amazon DataZone avec Studio. Il inclut un plan SageMaker AI permettant aux administrateurs de créer des environnements Studio à partir de projets Amazon DataZone au sein d’un domaine Amazon DataZone.

Les utilisateurs d’une application JupyterLab lancée à partir d’un domaine Studio créé avec le plan peuvent accéder automatiquement aux connexions AWS Glue aux ressources de données de leur catalogue Amazon DataZone lorsqu’ils utilisent l’extension SQL. Cela permet d’interroger ces sources de données sans configurer manuellement les connexions.