Création d’une tâche d’étiquetage (Console)
Vous pouvez utiliser la console Amazon SageMaker AI pour créer une tâche d’étiquetage pour tous les types de tâches intégrés Ground Truth et les flux de travail d’étiquetage personnalisés. Pour les types de tâches intégrés, nous vous recommandons d’utiliser cette page à côté de la page pour votre type de tâche. Chaque page de type de tâche contient des détails spécifiques sur la création d’une tâche d’étiquetage à l’aide de ce type de tâche.
Vous devez fournir les éléments suivants pour créer une tâche d’étiquetage dans la console SageMaker AI :
-
Un fichier manifeste source dans Amazon S3. Vous pouvez placer votre jeu de données d’entrée dans Amazon S3 et générer automatiquement un fichier manifeste à l’aide de la console Ground Truth (non pris en charge pour les tâches d’étiquetage de nuage de points 3D).
Vous pouvez également créer manuellement un fichier manifeste source. Pour savoir comment procéder, consultez Données d’entrée.
-
Un compartiment Amazon S3 pour stocker vos données de sortie.
-
Un rôle IAM disposant de l’autorisation d’accéder à vos ressources dans Amazon S3 et avec une stratégie d’exécution SageMaker AI attachée. Pour une solution générale, vous pouvez attacher la stratégie gérée AmazonSageMakerFullAccess à un rôle IAM et inclure
sagemakerdans le nom du compartiment.Pour obtenir des stratégies plus détaillées, consultez Attribuer des autorisations IAM pour utiliser Ground Truth.
Les types de tâches de nuage de points 3D comportent des considérations de sécurité supplémentaires. En savoir plus.
-
Une équipe de travail. Vous créez une équipe de travail à partir d’une main-d’œuvre composée d’employés Amazon Mechanical Turk, de fournisseurs ou de vos propres employés privés. Pour en savoir plus, consultez Mains-d’œuvre.
Vous ne pouvez pas utiliser la main-d’œuvre Mechanical Turk pour les tâches d’étiquetage de nuage de points 3D.
-
Si vous utilisez un flux de travail d’étiquetage personnalisé, vous devez enregistrer un modèle de tâche d’employé dans Amazon S3 et fournir un URI Amazon S3 pour ce modèle. Pour plus d’informations, consultez Création d’un modèle de tâche d’employé personnalisé.
-
(Facultatif) Un ARN de clé AWS KMS, si vous souhaitez que SageMaker AI chiffre la sortie de votre tâche d’étiquetage à l’aide de votre propre clé de chiffrement AWS KMS au lieu de la clé de service Amazon S3 par défaut.
-
(Facultatif) Des étiquettes existantes pour le jeu de données que vous utilisez pour votre tâche d’étiquetage. Utilisez cette option si vous souhaitez que les collaborateurs ajustent ou approuvent et rejettent les étiquettes.
-
Si vous souhaitez créer une tâche d’ajustement ou de vérification des étiquettes, vous devez disposer d’un fichier manifeste de sortie dans Amazon S3 qui contient les étiquettes que vous souhaitez ajuster ou vérifier. Cette option n’est prise en charge que pour les tâches d’étiquetage d’image de cadre de délimitation et de segmentation sémantique et les tâches d’étiquetage de nuage de points 3D et de trames vidéo. Il est recommandé d’utiliser les instructions sur Vérification et ajustement de l’étiquette pour créer une tâche de vérification ou d’ajustement des étiquettes.
Important
Votre équipe de travail, votre fichier manifeste source, votre compartiment de sortie et les autres ressources dans Amazon S3 doivent se trouver dans la même région AWS que celle que vous utilisez pour créer votre tâche d’étiquetage.
Lorsque vous créez une tâche d’étiquetage à l’aide de la console SageMaker AI, vous ajoutez des instructions et des étiquettes de travail à l’interface utilisateur employé fournie par Ground Truth. Vous pouvez prévisualiser l’interface utilisateur employé et interagir avec cette dernière lorsque vous créez une tâche d’étiquetage dans la console. Vous pouvez également voir une prévisualisation de l’interface utilisateur employé sur votre page de type de tâche intégrée.
Pour créer une tâche d’étiquetage (console)
-
Connectez-vous à la console SageMaker AI à l’adresse https://console.aws.amazon.com/sagemaker/
. -
Dans le panneau de navigation de gauche, choisissez Tâches d’étiquetage.
-
Sur la page Tâches d’étiquetage, choisissez Créer tâche d’étiquetage.
-
Pour Nom de la tâche, entrez un nom pour votre tâche d’étiquetage.
-
(Facultatif) Si vous souhaitez identifier vos étiquettes avec une clé, sélectionnez Je veux spécifier un nom d’attribut d’étiquette différent de celui du nom de la tâche d’étiquetage. Si vous ne sélectionnez pas cette option, le nom de la tâche d’étiquetage que vous avez spécifié à l’étape précédente sera utilisé pour identifier vos étiquettes dans votre fichier manifeste de sortie.
-
Choisissez une configuration de données pour créer une connexion entre votre jeu de données d’entrée et Ground Truth.
-
Pour Configuration automatisée des données :
-
Suivez les instructions de Automatiser la configuration des données pour les tâches d’étiquetage pour les tâches d’étiquetage d’images, de texte et de clips vidéo.
-
Suivez les instructions de Configuration automatisée des données d’entrée de trame vidéo pour les tâches d’étiquetage de trame vidéo.
-
-
Pour Configuration manuelle des données :
-
Pour Emplacement du jeu de données d’entrée, indiquez l’emplacement dans Amazon S3 où se trouve votre fichier manifeste source. Par exemple, si votre fichier manifeste source manifest.json se trouve dans example-bucket, entrez s3://example-bucket/manifest.json.
-
Pour Emplacement du jeu de données de sortie, indiquez l’emplacement dans Amazon S3 où vous souhaitez que Ground Truth stocke les données de sortie de votre tâche d’étiquetage.
-
-
-
Pour Rôle IAM, choisissez un rôle IAM existant ou créez un rôle IAM ayant l’autorisation d’accéder à vos ressources dans Amazon S3, d’écrire dans le compartiment de sortie Amazon S3 spécifié ci-dessus et ayant une stratégie d’exécution SageMaker AI attachée.
-
(Facultatif) Pour Configuration supplémentaire, vous pouvez spécifier la quantité de votre jeu de données que vous souhaitez voir étiquetée par vos employés et indiquer si vous souhaitez que SageMaker AI chiffre les données de sortie pour votre tâche d’étiquetage à l’aide d’une clé de chiffrement AWS KMS. Pour chiffrer vos données de sortie, vous devez disposer des autorisations AWS KMS requises associées au rôle IAM que vous avez fourni à l’étape précédente. Pour en savoir plus, consultez Attribuer des autorisations IAM pour utiliser Ground Truth.
-
Dans la section Type de tâche, sous Catégorie de tâche, utilisez le menu déroulant pour sélectionner votre catégorie de tâche.
-
Dans Sélection de la tâche, choisissez votre type de tâche.
-
(Facultatif) Fournissez des balises pour votre tâche d’étiquetage afin de la trouver plus facilement dans la console ultérieurement.
-
Choisissez Suivant.
-
Dans la section Employés, choisissez le type de main-d’œuvre que vous souhaitez utiliser. Pour plus d’informations sur les options de main-d’œuvre, consultez Mains-d’œuvre.
-
Après avoir sélectionné votre main-d’œuvre, spécifiez le Délai d’exécution de la tâche. Il s’agit de la durée maximale qu’un collaborateur doit consacrer à une tâche.
Pour les tâches d’annotation de nuage de points 3D, le délai d’exécution par défaut de la tâche est de 3 jours. Les délais d’exécution par défaut pour les tâches d’étiquetage de classification de texte et d’image, et de vérification des étiquettes, sont de 5 minutes. Les délais d’exécution par défaut pour tous les autres types de tâches d’étiquetage sont de 60 minutes.
-
(Facultatif) Pour les types de tâches de cadre de délimitation, de segmentation sémantique et de nuage de points 3D, vous pouvez sélectionner Afficher les étiquettes existantes si vous souhaitez afficher les étiquettes de votre jeu de données d’entrée afin que les employés puissent les vérifier ou les ajuster.
Pour les tâches d’étiquetage de cadre de délimitation et de segmentation sémantique, cela créera une tâche d’ajustement des étiquettes.
Pour les tâches d’étiquetage de nuage de points 3D et de trame vidéo :
-
Sélectionnez Ajustement pour créer une tâche d’étiquetage d’ajustement. Lorsque vous sélectionnez cette option, vous pouvez ajouter de nouvelles étiquettes, mais vous ne pouvez pas supprimer ou modifier les étiquettes existantes de la tâche précédente. Le cas échéant, vous pouvez choisir les attributs de catégorie d’étiquette et les attributs de trame que vous souhaitez voir modifier par les employés. Pour rendre un attribut modifiable, sélectionnez la case à cocher Autoriser les employés à modifier cet attribut pour cet attribut.
Vous pouvez également ajouter des attributs de catégorie d’étiquette et de trame.
-
Sélectionnez Vérification pour créer une tâche d’ajustement des étiquettes. Lorsque vous sélectionnez cette option, vous ne pouvez pas ajouter, modifier ou supprimer des étiquettes existantes dans la tâche précédente. Le cas échéant, vous pouvez choisir les attributs de catégorie d’étiquette et les attributs de trame que vous souhaitez voir modifier par les employés. Pour rendre un attribut modifiable, sélectionnez la case à cocher Autoriser les employés à modifier cet attribut pour cet attribut.
Nous vous recommandons d’ajouter de nouveaux attributs de catégorie d’étiquette aux étiquettes que les employés doivent vérifier, ou d’ajouter un ou plusieurs attributs de trame pour que les employés fournissent des informations sur l’ensemble de la trame.
Pour plus d’informations, consultez Vérification et ajustement de l’étiquette.
-
-
Configurez votre interface utilisateur employé :
-
Si vous utilisez un Type de tâche intégrée, spécifiez les instructions des employés et les étiquettes.
-
Pour la classification des images et la classification de texte (à étiquette unique et multiple), vous devez spécifier au moins deux catégories d’étiquettes. Pour tous les autres types de tâches intégrés, vous devez spécifier au moins une catégorie d’étiquette.
-
(Facultatif) Si vous créez une tâche d’étiquetage de nuage de points ou de trames vidéo 3D, vous pouvez spécifier des attributs de catégorie d’étiquette (non pris en charge pour la segmentation sémantique de nuage de points 3D) et des attributs de trame. Les attributs de catégorie d’étiquette peuvent être affectés à une ou plusieurs étiquettes. Les attributs de trame apparaîtront sur chaque étiquette de nuage de points ou de trames vidéo des employés. Pour en savoir plus, consultez Interface utilisateur (IU) d’employé pour les nuages de points 3D et Interface utilisateur (IU) d’employé pour les trames vidéo.
-
(Facultatif) Ajoutez Instructions supplémentaires pour aider votre employé à accomplir votre tâche.
-
-
Si vous créez un flux de travail d’étiquetage personnalisé, vous devez :
-
Saisir un modèle personnalisé dans la zone de code. Les modèles personnalisés peuvent être créés à l’aide d’une combinaison de HTML, du langage de modélisation Liquid et de nos composants Web prédéfinis. Vous pouvez également choisir un modèle de base dans le menu déroulant pour commencer.
-
Spécifiez les fonctions Lambda de pré-annotation et de post-annotation. Pour apprendre à créer ces fonctions, consultez Traitement des données dans un flux de travail d’étiquetage personnalisé avec AWS Lambda.
-
-
-
Vous pouvez sélectionner Voir la prévisualisation pour prévisualiser vos instructions de travail et les étiquettes, et interagir avec l’interface utilisateur employé. Assurez-vous que le bloqueur de fenêtres contextuelles du navigateur est désactivé avant de générer l’aperçu.
-
Choisissez Créer.
Une fois que vous avez créé votre tâche d’étiquetage avec succès, vous êtes redirigé vers la page Tâches d’étiquetage . Le statut de la tâche d’étiquetage que vous venez de créer est En cours. Ce statut est mis à jour au fur et à mesure que les collaborateurs terminent les tâches. Lorsque toutes les tâches sont terminées avec succès, le statut devient Terminé.
Si un problème s’est produit lors de la création de la tâche d’étiquetage, son statut passe à Échec.
Pour afficher plus de détails sur la tâche, choisissez le nom de la tâche d’étiquetage.
Étapes suivantes
Une fois que le statut de votre tâche d’étiquetage passe à Terminé, vous pouvez afficher vos données de sortie dans le compartiment Amazon S3 que vous avez spécifié lors de la création de cette tâche d’étiquetage. Pour plus d’informations sur le format de vos données de sortie, consultez Étiquetage des données de sortie des tâches.