Commencer à utiliser Amazon SageMaker Canvas - Amazon SageMaker AI

Commencer à utiliser Amazon SageMaker Canvas

Ce guide explique comment démarrer avec SageMaker Canvas. Si vous êtes un administrateur informatique et souhaitez obtenir des informations plus détaillées, consultez Configuration d’Amazon SageMaker Canvas et gestion des autorisations (pour les administrateurs informatiques) pour configurer SageMaker Canvas pour vos utilisateurs.

Prérequis pour configurer Amazon SageMaker Canvas

Pour configurer une application SageMaker Canvas, intégrez-la en utilisant l’une des méthodes de configuration suivantes :

  1. Intégration à l’aide de la console AWS. Pour procéder à l’intégration via la console AWS, vous devez d’abord créer un domaine Amazon SageMaker AI. Les domaines SageMaker AI prennent en charge les différents environnements de machine learning (ML) tels que Canvas et SageMaker Studio. Pour plus d’informations sur les domaines, consultez Présentation du domaine Amazon SageMaker AI.

    1. (Rapide) Utilisation de la configuration rapide pour Amazon SageMaker AI : choisissez cette option si vous souhaitez configurer rapidement un domaine. Cela accorde à votre utilisateur toutes les autorisations Canvas par défaut et les fonctionnalités de base. Toutes les fonctionnalités supplémentaires, telles que l’interrogation de documents, peuvent être activées ultérieurement par un administrateur. Si vous souhaitez configurer des autorisations plus précises, nous vous recommandons de choisir plutôt l’option Avancé.

    2. (Standard) Utilisation d’une configuration personnalisée pour Amazon SageMaker AI : choisissez cette option si vous souhaitez effectuer une configuration plus avancée de votre domaine. Maintenez un contrôle granulaire sur les autorisations des utilisateurs, telles que l’accès aux fonctionnalités de préparation des données, aux fonctionnalités d’IA générative et aux déploiements de modèles.

  2. Intégration à l’aide d’CloudFormation. CloudFormation automatise le provisionnement des ressources et des configurations afin que vous puissiez configurer Canvas pour un ou plusieurs profils utilisateur en même temps. Utilisez cette option si vous souhaitez automatiser le processus d’intégration à grande échelle et vous assurer que vos applications sont configurées de la même manière chaque fois. Le modèle CloudFormation suivant fournit une méthode rationalisée d’intégration à Canvas, en garantissant que tous les composants requis sont correctement configurés et en vous permettant de vous concentrer sur la génération et le déploiement de vos modèles de machine learning.

La section suivante décrit comment intégrer Canvas à l’aide de la console AWS pour créer un domaine.

Important

Pour pouvoir configurer Amazon SageMaker Canvas, vous devez utiliser la version 3.19.0 d’Amazon SageMaker Studio ou une version ultérieure. Pour obtenir des informations sur l’utilisation d’Amazon SageMaker Studio, consultez Arrêt et mise à jour d’Amazon SageMaker Studio Classic.

Intégration à l’aide de la console AWS

Si vous procédez à la configuration rapide du domaine, vous pouvez suivre les instructions fournies dans Utilisation de la configuration rapide pour Amazon SageMaker AI, ignorer le reste de cette section et passer à Étape 1 : Connexion à SageMaker Canvas.

Si vous effectuez la configuration standard du domaine, vous pouvez spécifier les fonctionnalités de Canvas auxquelles vous souhaitez accorder l’accès à vos utilisateurs. Utilisez le reste de cette section lorsque vous terminez la configuration standard du domaine pour vous aider à configurer les autorisations spécifiques à Canvas.

Dans les instructions de configuration Utilisation d’une configuration personnalisée pour Amazon SageMaker AI, pour Étape 2 : Utilisateurs et activités de machine learning, vous devez sélectionner les autorisations Canvas que vous souhaitez accorder. Dans la section Activités de machine learning, vous pouvez sélectionner les politiques d’autorisations suivantes pour accorder l’accès aux fonctionnalités de Canvas. Vous ne pouvez sélectionner que 8 activités de machine learning au total lors de la configuration de votre domaine. Les deux premières autorisations de la liste suivante sont requises pour utiliser Canvas, tandis que les autres concernent des fonctionnalités supplémentaires.

  • Exécuter des applications Studio : ces autorisations sont nécessaires pour démarrer l’application Canvas.

  • Accès principal à Canvas : ces autorisations vous donnent accès à l’application Canvas et aux fonctionnalités de base de Canvas, telles que la création de jeux de données, l’utilisation de transformations de données de base, ainsi que la génération et l’analyse de modèles.

  • (Facultatif) Préparation des données Canvas (optimisée par Data Wrangler) : ces autorisations vous donnent accès à la création de flux de données et à l’utilisation de transformations avancées pour préparer vos données dans Canvas. Ces autorisations sont également nécessaires pour créer des tâches de traitement des données et des planifications de tâches de préparation des données.

  • (Facultatif) Services Canvas AI : ces autorisations vous donnent accès aux modèles prêts à l’emploi, aux modèles de fondation et aux fonctionnalités de chat avec les données dans Canvas.

  • (Facultatif) Accès à Kendra : cette autorisation vous donne accès à la fonctionnalité d’interrogation de documents, qui vous permet d’interroger des documents stockés dans un index Amazon Kendra à l’aide de modèles de fondation dans Canvas.

    Si vous sélectionnez cette option, dans la section Accès à Kendra de Canvas, entrez les identifiants de vos index Amazon Kendra auxquels vous souhaitez accorder l’accès.

  • (Facultatif) MLOps Canvas : cette autorisation vous donne accès à la fonctionnalité de déploiement de modèles dans Canvas, où vous pouvez déployer des modèles pour une utilisation en production.

Dans la section Étape 3 : Applications de la configuration du domaine, choisissez Configuration de Canvas, puis procédez comme suit :

  1. Pour Configuration du stockage Canvas, spécifiez l’emplacement où vous souhaitez que Canvas stocke les données de l’application, telles que les artefacts de modèle, les prédictions par lots, les jeux de données et les journaux. SageMaker AI crée un dossier Canvas/ dans ce compartiment pour stocker les données. Pour plus d’informations, consultez Configuration de votre stockage Amazon S3. Pour cette section, procédez comme suit :

    1. Sélectionnez Géré par le système si vous souhaitez définir l’emplacement sur le compartiment par défaut créé par SageMaker AI selon le modèle s3://sagemaker-{Region}-{your-account-id}.

    2. Sélectionnez S3 personnalisé pour spécifier votre propre compartiment Amazon S3 comme emplacement de stockage. Entrez ensuite l'URI d'Amazon S3.

    3. (Facultatif) Pour Clé de chiffrement, spécifiez une clé KMS permettant de chiffrer les artefacts Canvas stockés à l’emplacement spécifié.

  2. (Facultatif) Pour Amazon Q Developer, procédez comme suit :

    1. Activez l’option Activer Amazon Q Developer dans SageMaker Canvas pour le machine learning en langage naturel afin d’autoriser vos utilisateurs à tirer parti de l’assistance de l’IA générative pendant leur flux de travail ML dans Canvas. Cette option accorde uniquement les autorisations nécessaires pour demander de l’aide à Amazon Q Developer pour des tâches prédéterminées pouvant être effectuées dans l’application Canvas.

    2. Activez l’option Activer le chat Amazon Q Developer pour des questions AWS générales afin d’autoriser vos utilisateurs à effectuer des requêtes d’IA générative liées aux services AWS.

  3. (Facultatif) Configurez la section Traitement des données volumineuses si vos utilisateurs prévoient de traiter des jeux de données supérieurs à 5 Go dans Canvas. Pour obtenir des informations plus détaillées sur la configuration de ces options, consultez Octroi aux utilisateurs d’autorisations pour utiliser des données volumineuses tout au long du cycle de vie du machine learning.

  4. (Facultatif) Pour la section Configuration des autorisations ML Ops, procédez comme suit :

    1. Laissez l’option Activer le déploiement direct des modèles Canvas activée pour autoriser vos utilisateurs à déployer leurs modèles depuis Canvas vers un point de terminaison SageMaker AI. Pour plus d’informations sur le déploiement de modèles dans Canvas, consultez Déploiement de vos modèles sur un point de terminaison.

    2. Laissez l’option Activer les autorisations d’enregistrement au registre de modèles pour tous les utilisateurs activée pour autoriser vos utilisateurs à enregistrer leur version de modèle dans le registre de modèles SageMaker AI (cette option est activée par défaut). Pour plus d’informations, consultez Enregistrement d’une version de modèle dans le registre de modèles SageMaker AI.

    3. Si vous avez laissé l’option Activer les autorisations d’enregistrement au registre de modèles pour tous les utilisateurs activée, sélectionnez Enregistrer uniquement dans le registre de modèles ou Enregistrer et approuver le modèle dans le registre de modèles.

  5. (Facultatif) Dans la section Configuration de chargement de fichier local, activez l’option Activer le téléchargement de fichiers locaux pour autoriser vos utilisateurs à charger des fichiers dans Canvas à partir de leurs ordinateurs locaux. L’activation de cette option attache une politique de partage de ressources entre origines (CORS) au compartiment Amazon S3 spécifié dans la configuration de stockage Canvas (et remplace toute politique CORS existante). Pour en savoir plus sur les autorisations de chargement de fichiers locaux, consultez Attribution à vos utilisateurs de l'autorisation de charger des fichiers locaux.

  6. (Facultatif) Pour la section Paramètres OAuth, procédez comme suit :

    1. Choisissez Ajouter une configuration OAuth.

    2. Pour Source de données, sélectionnez votre source de données.

    3. Pour Configuration secrète, sélectionnez Créer un nouveau secret et entrez les informations que vous avez obtenues de votre fournisseur d’identité. Si vous n’avez pas encore effectué la configuration initiale d’OAuth avec votre source de données, consultez Configuration de connexions aux sources de données avec OAuth.

  7. (Facultatif) Pour Configuration des modèles canevas prêts à l’emploi, procédez comme suit :

    1. Laissez l’option Activer les modèles Canvas prêts à l’emploi activée pour autoriser vos utilisateurs à générer des prédictions avec des modèles prêts à l’emploi dans Canvas (cette option est activée par défaut). Cette option vous donne également l’autorisation de discuter avec des modèles basés sur l’IA générative. Pour plus d’informations, consultez Modèles de fondation d’IA générative dans SageMaker Canvas.

    2. Laissez l’option Activer la recherche de documents à l’aide d’Amazon Kendra activée pour autoriser vos utilisateurs à utiliser des modèles de fondation pour interroger des documents stockés dans un index Amazon Kendra. Ensuite, dans le menu déroulant, sélectionnez les index existants auxquels vous souhaitez accorder l’accès. Pour plus d’informations, consultez Modèles de fondation d’IA générative dans SageMaker Canvas.

    3. Pour Rôle Amazon Bedrock, sélectionnez Créer et utiliser un nouveau rôle d’exécution pour créer un nouveau rôle d’exécution IAM qui possède une relation d’approbation avec Amazon Bedrock. Ce rôle IAM est assumé par Amazon Bedrock pour optimiser les grands modèles de langage (LLM) dans Canvas. Si vous avez déjà un rôle d’exécution avec une relation d’approbation, sélectionnez Utiliser un rôle d’exécution existant et choisissez votre rôle dans la liste déroulante. Pour plus d’informations sur la configuration manuelle des autorisations pour votre propre rôle d’exécution, consultez Octroi d’autorisations aux utilisateurs pour utiliser Amazon Bedrock et les fonctionnalités d’IA générative dans Canvas.

  8. Terminez la configuration du reste des paramètres du domaine à l’aide des procédures Utilisation d’une configuration personnalisée pour Amazon SageMaker AI.

Note

Si vous rencontrez des problèmes lors de l’octroi d’autorisations via la console, telles que les autorisations pour les modèles prêts à l’emploi, consultez Résolution des problèmes liés à l’octroi d’autorisations via la console SageMaker AI.

Vous devriez maintenant avoir configuré un domaine SageMaker AI et toutes les autorisations Canvas configurées.

Vous pouvez modifier les autorisations Canvas pour un domaine ou un utilisateur spécifique après la configuration initiale du domaine. Les paramètres utilisateur individuels remplacent les paramètres du domaine. Pour découvrir comment modifier vos autorisations Canvas dans les paramètres du domaine, consultez Modification des paramètres du domaine.

Accordez-vous les autorisations nécessaires pour utiliser des fonctionnalités spécifiques dans Canvas

Les informations suivantes décrivent les diverses autorisations que vous pouvez accorder à un utilisateur Canvas pour autoriser l’utilisation de diverses fonctionnalités dans Canvas. Certaines de ces autorisations peuvent être accordées lors de la configuration du domaine, mais d’autres nécessitent des autorisations ou une configuration supplémentaires. Reportez-vous aux informations d’autorisation spécifiques pour chaque fonctionnalité que vous souhaitez activer :

  • Chargement de fichiers locaux. Les autorisations de chargement de fichiers locaux sont activées par défaut dans les autorisations de base Canvas lors de la configuration de votre domaine. Si vous ne pouvez pas charger des fichiers locaux à partir de votre ordinateur vers SageMaker Canvas, vous pouvez attacher une politique CORS au compartiment Amazon S3 que vous avez spécifié dans la configuration de stockage Canvas. Si vous avez autorisé SageMaker AI à utiliser le compartiment par défaut, celui-ci utilise le modèle de dénomination s3://sagemaker-{Region}-{your-account-id}. Pour plus d’informations, consultez Octroi d’autorisations à vos utilisateurs pour charger des fichiers locaux.

  • Modèles de prédiction d'image et de texte personnalisés. Les autorisations de génération de modèles de prédiction d’image et de texte personnalisés sont activées par défaut dans les autorisations de base Canvas lors de la configuration de votre domaine. Toutefois, si vous disposez d'une configuration IAM personnalisée et que vous ne souhaitez pas attacher la politique AmazonSageMakerCanvasFullAccess au rôle d'exécution IAM de votre utilisateur, vous devez explicitement accorder à votre utilisateur les autorisations nécessaires. Pour plus d’informations, consultez Octroi à vos utilisateurs des autorisations nécessaires pour créer des modèles de prédiction d’image et de texte personnalisés.

  • Modèles de fondation et modèles prêts à l’emploi. Vous souhaiterez peut-être utiliser les modèles prêts à l’emploi Canvas pour effectuer des prédictions pour vos données. Avec les autorisations des modèles prêts à l’emploi, vous pouvez également discuter avec des modèles basés sur l’IA générative. Les autorisations sont activées par défaut lors de la configuration de votre domaine, ou vous pouvez modifier les autorisations d’un domaine que vous avez déjà créé. L'option d'autorisation des modèles prêts à l'emploi Canvas ajoute la politique AmazonSageMakerCanvasAIServicesAccess à votre rôle d'exécution. Pour plus d’informations, consultez la section Mise en route de la documentation des modèles prêts à l’emploi.

    Pour plus d’informations sur la prise en main des modèles de fondation d’IA générative, consultez Modèles de fondation d’IA générative dans SageMaker Canvas.

  • Peaufinage des modèles de fondation. Si vous souhaitez optimiser les modèles de fondation dans Canvas, vous pouvez soit ajouter des autorisations lors de la configuration de votre domaine, soit modifier les autorisations du domaine ou du profil utilisateur après avoir créé votre domaine. Vous devez ajouter la politique AmazonSageMakerCanvasAIServicesAccess au rôle AWS IAM que vous avez choisi lors de la configuration du profil utilisateur, et vous devez également ajouter une relation d’approbation avec Amazon Bedrock au rôle. Pour obtenir des instructions sur l’ajout de ces autorisations à votre rôle IAM, consultez Octroi d’autorisations aux utilisateurs pour utiliser Amazon Bedrock et les fonctionnalités d’IA générative dans Canvas.

  • Envoi de vos prédictions par lots à QuickSight. Vous souhaiterez peut-être envoyer des prédictions par lots ou des jeux de données de prédictions que vous générez à partir d’un modèle personnalisé, à QuickSight à des fins d’analyse. Dans QuickSight, vous pouvez créer et publier des tableaux de bord prédictifs avec les résultats de vos prédictions. Pour obtenir des instructions sur la façon d’ajouter ces autorisations au rôle IAM de votre utilisateur Canvas, consultez Octroi d’autorisations à vos utilisateurs pour envoyer des prédictions à QuickSight.

  • Déploiement de modèles Canvas sur un point de terminaison SageMaker AI. SageMaker AI Hosting propose des points de terminaison que vous pouvez utiliser pour déployer votre modèle en vue de son utilisation en production. Vous pouvez déployer des modèles intégrés à Canvas sur un point de terminaison SageMaker AI, puis effectuer des prédictions par programmation dans un environnement de production. Pour plus d’informations, consultez Déploiement de vos modèles sur un point de terminaison.

  • Enregistrement des versions de modèle dans le registre des modèles. Vous souhaiterez peut-être enregistrer les versions de votre modèle dans le registre de modèles SageMaker AI, qui est un référentiel permettant de suivre le statut des versions mises à jour de votre modèle. Un scientifique des données ou une équipe MLOps travaillant dans le registre de modèles SageMaker peut consulter les versions de votre modèle que vous avez générées et les approuver ou les rejeter. Ils peuvent ensuite déployer la version de votre modèle en production ou lancer un flux de travail automatisé. Les autorisations d’enregistrement des modèles sont activées par défaut pour votre domaine. Vous pouvez gérer les autorisations au niveau du profil utilisateur et accorder ou retirer des autorisations à des utilisateurs spécifiques. Pour plus d’informations, consultez Enregistrement d’une version de modèle dans le registre de modèles SageMaker AI.

  • Importation de données à partir d’Amazon Redshift. Si vous souhaitez importer des données depuis Amazon Redshift, vous devez vous accorder des autorisations supplémentaires. Vous devez ajouter la politique gérée AmazonRedshiftFullAccess au rôle IAM AWS que vous avez choisi lors de la configuration du profil utilisateur. Pour savoir comment ajouter la politique au rôle, consultez Octroi d'autorisations aux utilisateurs pour importer des données Amazon Redshift (langue française non garantie).

Note

Les autorisations nécessaires pour importer via d'autres sources de données, telles qu'Amazon Athena et les plateformes SaaS, sont incluses dans les politiques AmazonSageMakerFullAccess et AmazonSageMakerCanvasFullAccess. Si vous avez suivi les instructions de configuration standard, ces politiques devraient déjà être attachées à votre rôle d'exécution. Pour plus d’informations sur ces sources de données et leurs autorisations, consultez Connexion aux sources de données.

Étape 1 : Connexion à SageMaker Canvas

Une fois la configuration initiale terminée, vous pouvez accéder à SageMaker Canvas avec l’une des méthodes suivantes, selon votre cas d’utilisation :

  • Dans la console SageMaker AI, choisissez le Canvas dans le volet de navigation de gauche. Ensuite, sur la page Canvas, sélectionnez votre utilisateur dans le menu déroulant et lancez l’application Canvas.

  • Ouvrez SageMaker Studio, puis dans l’interface Studio, accédez à la page Canvas et lancez l’application Canvas.

  • Utilisez les méthodes SSO basées sur SAML 2.0 de votre organisation, telles qu’Okta ou IAM Identity Center.

Lorsque vous vous connectez à SageMaker Canvas pour la première fois, SageMaker AI crée l’application et un espace SageMaker AI pour vous. Les données de l’application Canvas sont stockées dans cet espace. Pour plus d’informations sur les espaces, consultez Collaboration avec des espaces partagés. L’espace comprend les applications de votre profil utilisateur et un répertoire partagé pour toutes les données de vos applications. Si vous ne souhaitez pas utiliser l’espace par défaut créé par SageMaker AI et préférez créer votre propre espace pour stocker les données de l’application, consultez la page Stockage des données de l’application SageMaker Canvas dans votre propre espace SageMaker AI.

Étape 2 : Utiliser SageMaker Canvas pour obtenir des prédictions

Une fois connecté à Canvas, vous pouvez commencer à créer des modèles et à générer des prédictions pour vos données.

Vous pouvez soit utiliser les modèles prêts à l'emploi Canvas pour effectuer des prédictions sans créer de modèle, soit créer un modèle personnalisé pour votre problème métier spécifique. Consultez les informations suivantes pour déterminer si les modèles prêts à l'emploi ou les modèles personnalisés conviennent le mieux à votre cas d'utilisation.

  • Modèles prêts à l'emploi. Avec les modèles prêts à l'emploi, vous pouvez utiliser des modèles prédéfinis pour extraire des informations de vos données. Les modèles prêts à l'emploi couvrent une variété de cas d'utilisation, tels que la détection de la langue et l'analyse de documents. Pour commencer à effectuer des prédictions avec des modèles prêts à l'emploi, consultez Modèles prêts à l’emploi.

  • Modèles personnalisés. Avec les modèles personnalisés, vous pouvez créer différents types de modèles personnalisés pour effectuer des prédictions pour vos données. Utilisez des modèles personnalisés si vous souhaitez générer un modèle entraîné sur les données spécifiques à votre entreprise et si vous souhaitez utiliser des fonctionnalités telles que l’évaluation des performances de votre modèle. Pour commencer à créer un modèle personnalisé, consultez Modèles personnalisés.