Connexions aux sources de données de l’extension SQL - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Connexions aux sources de données de l’extension SQL

Avant d'utiliser l'extension SQL dans les JupyterLab blocs-notes, les administrateurs ou les utilisateurs doivent créer des AWS Glue connexions à leurs sources de données. L’extension SQL permet de se connecter à des sources de données telles qu’Amazon Redshift, Amazon Athena ou Snowflake.

Pour configurer les connexions, les administrateurs doivent d’abord s’assurer que leur configuration réseau autorise la communication entre Studio et les sources de données, puis accorder les autorisations IAM nécessaires pour permettre à Studio d’accéder aux sources de données. Pour en savoir plus sur la manière dont les administrateurs peuvent configurer la mise en réseau, consultez Configuration de l’accès réseau entre Studio et les sources de données (pour les administrateurs). Pour en savoir plus sur les politiques à configurer, consultez Configuration des autorisations IAM pour accéder aux sources de données (pour les administrateurs). Une fois les connexions établies, les data scientists peuvent utiliser l'extension SQL dans leurs JupyterLab blocs-notes pour parcourir et interroger les sources de données connectées.

Note

Nous vous recommandons de stocker vos informations d’identification et d’accès à la base de données en tant que secret dans Secrets Manager. Pour découvrir comment créer des secrets pour stocker les informations d’identification et d’accès à Amazon Redshift ou Snowflake, consultez Création de secrets pour les informations d’identification et d’accès à la base de données dans Secrets Manager.

Cette section explique comment configurer une AWS Glue connexion et répertorie les autorisations IAM requises pour que l' JupyterLab application Studio puisse accéder aux données via la connexion.

Note

Amazon SageMaker Assets intègre Amazon DataZone à Studio. Il inclut un plan d' SageMaker intelligence artificielle permettant aux administrateurs de créer des environnements Studio à partir de DataZone projets Amazon au sein d'un DataZone domaine Amazon.

Les utilisateurs d'une JupyterLab application lancée à partir d'un domaine Studio créé avec le plan peuvent accéder automatiquement aux AWS Glue connexions aux actifs de données de leur DataZone catalogue Amazon lorsqu'ils utilisent l'extension SQL. Cela permet d’interroger ces sources de données sans configurer manuellement les connexions.