Utilisation d’Amazon SageMaker Feature Store dans la console - Amazon SageMaker AI

Utilisation d’Amazon SageMaker Feature Store dans la console

Important

Les politiques IAM personnalisées qui autorisent Amazon SageMaker Studio ou Amazon SageMaker Studio Classic à créer des ressources Amazon SageMaker doivent également accorder des autorisations pour ajouter des balises à ces ressources. L’autorisation d’ajouter des balises aux ressources est requise, car Studio et Studio Classic balisent automatiquement toutes les ressources qu’ils créent. Si une politique IAM autorise Studio et Studio Classic à créer des ressources mais n’autorise pas le balisage, des erreurs « AccessDenied » peuvent se produire lors de la tentative de création de ressources. Pour plus d’informations, consultez Octroi d’autorisations pour baliser les ressources SageMaker AI.

Les Politiques gérées par AWS pour Amazon SageMaker AI qui autorisent la création de ressources SageMaker incluent déjà des autorisations permettant d’ajouter des balises lors de la création de ces ressources.

Vous pouvez utiliser Amazon SageMaker Feature Store sur la console pour créer, visualiser, mettre à jour et surveiller vos groupes de caractéristiques. La surveillance décrite dans ce guide inclut la visualisation des exécutions de pipelines et de la traçabilité de vos groupes de caractéristiques. Ce guide fournit des instructions sur la manière d’effectuer ces tâches depuis la console.

Pour des exemples et des ressources Feature Store utilisant les API Amazon SageMaker et le kit AWS SDK for Python (Boto3), consultez Ressources Amazon SageMaker Feature Store.

Création d’un groupe de caractéristiques depuis la console

Le processus de création d’un groupe de caractéristiques comporte quatre étapes :

  1. Entrez les informations du groupe de fonctionnalités.

  2. Saisissez les définitions de fonctions.

  3. Entrez les fonctionnalités requises.

  4. Entrez les balises du groupe de fonctionnalités.

Parmi les options suivantes, déterminez laquelle est adaptée à votre cas d’utilisation :

  • Créez un magasin en ligne, un magasin hors connexion ou les deux. Pour plus d’informations sur les différences entre les magasins en ligne et hors ligne, consultez Concepts liés à Feature Store.

  • Utilisez une clé AWS Key Management Service par défaut ou votre propre clé KMS. La clé par défaut est la clé AWS KMS (SSE-KMS). Vous pouvez réduire les coûts liés aux demandes AWS KMS en configurant l’utilisation des clés de compartiment Amazon S3 sur le compartiment Amazon S3 du magasin hors ligne. La clé d’un compartiment Amazon S3 doit être activée avant l’utilisation du compartiment pour vos groupes de caractéristiques. Pour plus d’informations sur la réduction du coût via l’utilisation des clés de compartiment Amazon S3, consultez Réduction du coût du SSE-KMS avec les clés de compartiment Amazon S3.

    Vous pouvez utiliser la même clé pour les magasins en ligne et hors connexion, ou utiliser une clé unique pour chaque magasin. Pour plus d’informations sur AWS KMS, consultez AWS Key Management Service.

  • Si vous créez un magasin hors connexion :

    • Décidez si vous souhaitez créer un compartiment Amazon S3 ou en utiliser un existant. Lorsque vous utilisez un magasin existant, vous devez connaître l’URL du compartiment Amazon S3 ou le nom du compartiment Amazon S3 et le nom du répertoire du jeu de données, le cas échéant.

    • Choisissez l’Amazon Resource Name (ARN) à utiliser pour spécifier le rôle IAM. Pour plus d’informations sur la manière de rechercher votre rôle et les politiques attachées, consultez Ajout de politiques à votre rôle IAM.

    • Décidez d’utiliser le format de table AWS Glue (par défaut) ou Apache Iceberg. Dans la plupart des cas d’utilisation, vous utilisez le format de table Apache Iceberg. Pour plus d’informations sur les formats de table, consultez Utilisation de Feature Store avec le kit SDK pour Python (Boto3).

Vous pouvez utiliser la console pour visualiser la traçabilité d’un groupe de caractéristiques. Les instructions relatives à l’utilisation de Feature Store sur la console varient selon que vous avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio Classic comme expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dans Lancement d’Amazon SageMaker Studio.

  2. Choisissez Données dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. Choisissez Créer un groupe de caractéristiques.

  5. Sous Détails des groupes de fonctionnalités, entrez un nom de groupe de fonctionnalités.

  6. (Facultatif) Entrez une description du groupe de caractéristiques.

  7. Sous Configuration du stockage des groupes de caractéristiques, choisissez une configuration de stockage dans la liste déroulante. Pour en savoir plus sur les configurations de stockage, consultez Configurations de stockage Feature Store.

  8. Si vous avez choisi d’activer le stockage en ligne :

    1. Si vous activez uniquement le stockage en ligne, vous pouvez choisir un type de stockage dans la liste déroulante. Pour en savoir plus sur les types de stockage des magasins en ligne, consultez Magasin en ligne.

    2. (Facultatif) Appliquez Durée de vie (TTL) en basculant l’interrupteur sur Activé et en spécifiant la valeur et l’unité de Durée de vie. Cela mettra à jour la durée TTL par défaut pour tous les enregistrements ajoutés au groupe de caractéristiques après la création de ce dernier. Pour plus d’informations sur TTL, consultez Durée de vie (TTL) pour les enregistrements.

  9. Si vous avez choisi d’activer le stockage hors ligne :

    1. Sous le nom du compartiment Amazon S3, entrez un nouveau nom de compartiment ou saisissez manuellement l’URL d’un compartiment existant.

    2. Dans la liste déroulante Format de table, choisissez le format de table. Dans la plupart des cas d’utilisation, vous devriez utiliser le format de table Apache Iceberg. Pour plus d’informations sur les formats de table, consultez Utilisation de Feature Store avec le kit SDK pour Python (Boto3).

    3. Sous ARN du rôle IAM, choisissez l’ARN du rôle IAM que vous souhaitez attacher à ce groupe de caractéristiques. Pour plus d’informations sur la manière de rechercher votre rôle et les politiques attachées, consultez Ajout de politiques à votre rôle IAM.

    4. Si vous avez choisi d’activer le format de table pour le stockage hors ligne et le format de table AWS Glue (par défaut), sous Catalogue de données, vous pouvez choisir l’une des deux options suivantes :

      • Utiliser les valeurs par défaut pour votre AWS Glue Data Catalog.

      • Indiquer le nom de votre catalogue de données, le nom de la table et le nom de la base de données existants pour étendre votre AWS Glue Data Catalog existant.

  10. Sous la liste déroulante Clé de chiffrement du magasin en ligne ou Clé de chiffrement du magasin hors ligne, choisissez l’une des options suivantes :

    • Utiliser la AWS KMS key gérée par AWS (par défaut)

    • Entrer un ARN de AWS KMS key et entrer votre ARN de clé AWS KMS sous ARN de clé de chiffrement du magasin hors ligne. Pour plus d’informations sur AWS KMS, consultez AWS Key Management Service.

  11. Le cas échéant, vous aurez la possibilité de choisir votre mode de débit, ce qui affectera votre mode de facturation. Sous Mode de débit, choisissez un mode dans la liste déroulante et entrez les capacités de lecture et d’écriture lorsqu’elles sont disponibles. Pour en savoir plus sur les modes de débit, par exemple le moment où le mode peut être appliqué et les unités de capacité, consultez Modes de débit.

  12. Une fois que vous avez spécifié toutes les informations requises, le bouton Continuer est disponible. Choisissez Continuer.

  13. Sous Spécifier les définitions de caractéristiques, deux options s’offrent à vous pour fournir un schéma de vos caractéristiques : un éditeur JSON ou un éditeur de table.

    • Éditeur JSON : dans l’onglet JSON, saisissez ou copiez-collez vos définitions de caractéristiques au format JSON.

    • Éditeur de table : dans l’onglet Table, saisissez le nom de la caractéristique et choisissez le type de données correspondant pour chaque caractéristique de votre groupe de caractéristiques. Choisissez + Ajouter des définitions de caractéristiques pour inclure d’autres caractéristiques. Sachez que vous ne pouvez pas supprimer les définitions de caractéristiques de vos groupes de caractéristiques. Vous pouvez toutefois ajouter et mettre à jour les définitions de caractéristiques après la création du groupe de caractéristiques.

    Un groupe de caractéristiques doit comporter au moins deux caractéristiques représentant l’identifiant de l’enregistrement et l’heure de l’événement :

    • Le type de caractéristique de l’enregistrement peut être une chaîne, une fraction ou un nombre entier.

    • Le type de caractéristique de l’heure d’événement doit être une chaîne ou une fraction. Toutefois, si vous avez choisi le format de table Iceberg, l’heure d’événement doit être une chaîne.

  14. Une fois que toutes les caractéristiques sont incluses, choisissez Continuer.

  15. Sous Sélectionner les caractéristiques requises, vous devez spécifier l’identifiant de l’enregistrement et les caractéristiques de l’heure d’événement. Pour ce faire, choisissez le nom de la caractéristique sous les listes déroulantes Nom de la caractéristique d’identifiant d’enregistrement et Nom de la caractéristique d’heure d’événement, respectivement.

  16. Après avoir choisi les caractéristiques d’identifiant d’enregistrement et d’heure d’événement, choisissez Continuer.

  17. (En option) Pour ajouter des balises pour le groupe de caractéristiques, choisissez Ajouter une nouvelle balise. Entrez ensuite une clé de balise et la valeur correspondante sous Clé et Valeur, respectivement.

  18. Choisissez Continuer.

  19. Sous Vérifier le groupe de caractéristiques, passez en revue les informations du groupe de caractéristiques. Pour modifier une étape quelconque, choisissez le bouton Modifier correspondant à cette étape. Cela vous amène à l’étape de modification correspondante. Pour revenir à l’étape 5, choisissez Continuer jusqu’à ce que vous reveniez à l’étape 5.

  20. Après avoir finalisé la configuration de votre groupe de caractéristiques, choisissez Créer le groupe de caractéristiques.

    En cas de problème pendant la configuration, un message d’alerte contextuel apparaît au bas de la page avec des conseils pour résoudre le problème. Vous pouvez revenir aux étapes précédentes pour corriger les problèmes en choisissant Modifier pour l’étape présentant des conflits.

    Une fois que le groupe de caractéristiques a été créé avec succès, un message contextuel vert apparaît au bas de la page. Le nouveau groupe de caractéristiques s’affiche également dans votre catalogue de groupes de caractéristiques.

Visualisation des détails des groupes de caractéristiques depuis la console

Vous pouvez visualiser les détails de vos groupes de caractéristiques une fois qu’un groupe de caractéristiques a été créé avec succès dans le magasin de caractéristiques.

Vous pouvez utiliser la console ou l’API Amazon SageMaker Feature Store pour visualiser les détails de vos groupes de caractéristiques. Les instructions relatives à l’utilisation de Feature Store via la console varient selon que vous avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio Classic comme expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dans Lancement d’Amazon SageMaker Studio.

  2. Choisissez Données dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour visualiser vos groupes de caractéristiques, choisissez Mon compte. Pour visualiser les groupes de caractéristiques partagés, choisissez Compte croisé.

  5. Sous l’onglet Catalogue de groupes de caractéristiques, choisissez le nom de votre groupe de caractéristiques dans la liste. La page du groupe de caractéristiques s’ouvre.

  6. Dans l’onglet Fonctionnalités, vous trouverez la liste de toutes les fonctionnalités. Utilisez le filtre pour affiner votre liste. Choisissez une fonction pour en afficher les détails.

  7. Sous l’onglet Détails et le sous-onglet Informations, vous pouvez passer en revue les informations de votre groupe de caractéristiques. Cela inclut Dernière exécution, Paramètres de stockage hors ligne, Paramètres de stockage en ligne, etc.

  8. Sous l’onglet Détails et le sous-onglet Balises, vous pouvez passer en revue les balises de votre groupe de caractéristiques. Choisissez Ajouter une nouvelle balise pour ajouter une nouvelle balise ou Supprimer pour supprimer une balise.

  9. Sous l’onglet Exécutions de pipelines, vous pouvez visualiser les pipelines ou les exécutions de pipeline associés à votre groupe de caractéristiques.

  10. Sous l’onglet Lignage, vous pouvez visualiser la traçabilité de votre groupe de caractéristiques.

Mise à jour d’un groupe de caractéristiques depuis la console

Vous pouvez mettre à jour vos groupes de caractéristiques une fois qu’un groupe de caractéristiques a été créé avec succès dans le magasin de caractéristiques.

Vous pouvez utiliser la console ou l’API Amazon SageMaker Feature Store pour mettre à jour un groupe de caractéristiques. Les instructions relatives à l’utilisation de Feature Store via la console varient selon que vous avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio Classic comme expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dans Lancement d’Amazon SageMaker Studio.

  2. Choisissez Données dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour visualiser vos groupes de caractéristiques, choisissez Mon compte. Pour visualiser les groupes de caractéristiques partagés, choisissez Compte croisé.

  5. Sous l’onglet Catalogue de groupes de caractéristiques, recherchez et choisissez le nom de votre groupe de caractéristiques dans la liste. La page du groupe de fonctionnalités s'ouvre.

  6. Choisissez Mettre à jour le groupe de fonctionnalités.

  7. (Facultatif) Le cas échéant, vous pouvez modifier votre mode de débit, ce qui a un impact sur votre mode de facturation. Sous Mode de débit, choisissez un mode dans la liste déroulante et entrez les capacités de lecture et d’écriture lorsqu’elles sont disponibles. Pour en savoir plus sur les modes de débit, par exemple le moment où le mode peut être appliqué et les unités de capacité, consultez Modes de débit.

  8. (Facultatif) Si votre groupe de fonctionnalités utilise le magasin en ligne, vous pouvez mettre à jour le paramètre Durée de vie (TTL) par défaut. Si la durée de vie (TTL) n'a pas été activée pour le groupe de fonctionnalités, basculez l'interrupteur situé sous Durée de vie (TTL) sur Activé. Vous pouvez spécifier la valeur et l'unité TTL sous Durée de vie. Cela mettra à jour la durée TTL par défaut pour tous les enregistrements ajoutés au groupe de fonctionnalités après la mise à jour du groupe de fonctionnalités.

  9. (Facultatif) Vous pouvez ajouter des définitions de caractéristique à votre groupe de caractéristiques, mais sachez que vous ne pouvez pas supprimer les définitions de caractéristique de vos groupes de caractéristiques. Pour ajouter une définition de caractéristique, choisissez + Ajouter une définition de caractéristique, puis spécifiez le nouveau nom de définition de caractéristique dans la colonne Nom et sélectionnez le type de caractéristique dans la colonne Type de caractéristique.

  10. Sélectionnez Enregistrer les modifications.

  11. Pour confirmer vos modifications, choisissez Confirmer.

Visualisation des exécutions de pipelines depuis la console

Vous pouvez visualiser les dernières informations d’exécution de pipeline pour une caractéristique ou un groupe de caractéristiques sous Exécutions des pipelines. Vous pouvez également obtenir des liens vers les pipelines, les exécutions, le code et d’autres informations d’exécution utiles.

Vous pouvez utiliser la console pour visualiser vos exécutions de pipelines. Les instructions relatives à l’utilisation de Feature Store via la console varient selon que vous avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio Classic comme expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dans Lancement d’Amazon SageMaker Studio.

  2. Choisissez Données dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour visualiser vos groupes de caractéristiques, choisissez Mon compte. Pour visualiser les groupes de caractéristiques partagés, choisissez Compte croisé.

  5. Choisissez un groupe de caractéristiques ou une caractéristique dont vous souhaitez voir les exécutions des pipelines.

  6. Choisissez l’onglet Exécutions des pipelines.

  7. Recherchez un pipeline dans la liste déroulante Sélectionner un pipeline.

  8. Vous pouvez visualiser les liens relatifs aux détails de pipeline, d’exécution et de code. Vous pouvez également visualiser le propriétaire, le statut, la date et la durée de l’exécution.

Visualisation de la traçabilité depuis la console

Vous pouvez afficher la lignée d’un groupe de caractéristiques. La lignée inclut les informations relatives au code d’exécution de votre flux de travail d’intégration de caractéristiques, aux sources de données utilisées et à la manière dont elles sont ingérées dans le groupe de caractéristiques ou la caractéristique.

Vous pouvez utiliser la console pour visualiser la traçabilité d’un groupe de caractéristiques. Les instructions relatives à l’utilisation de Feature Store via la console varient selon que vous avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio Classic comme expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dans Lancement d’Amazon SageMaker Studio.

  2. Choisissez Données dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour visualiser vos groupes de caractéristiques, choisissez Mon compte. Pour visualiser les groupes de caractéristiques partagés, choisissez Compte croisé.

  5. Choisissez un groupe de caractéristiques ou une caractéristique pour en afficher les détails de traçabilité.

  6. Choisissez l’onglet Lignée.

  7. Choisissez un groupe de fonctionnalités ou un nœud de pipeline pour étendre le nœud. Il contient des informations supplémentaires sur un groupe de fonctionnalités ou un pipeline.

  8. Vous pouvez zoomer, dézoomer ou recentrer le graphe de lignée à l’aide des boutons situés en bas à gauche de l’écran.

  9. Vous pouvez vous déplacer sur la carte de traçabilité quand vous décidez de faire glisser l’écran. Pour déplacer vos cartes de traçabilité en utilisant les nœuds comme point focal, vous pouvez appuyer sur Tab ou sur Maj+Tab pour passer d’un nœud à l’autre.

  10. Le cas échéant, vous pouvez parcourir la traçabilité en amont (antérieure à gauche) ou en aval (plus récente à droite). Pour ce faire, choisissez un nœud, puis choisissez Interroger la traçabilité en amont ou Interroger la traçabilité en aval.