Utiliser Amazon SageMaker Ground Truth Plus pour étiqueter les données
Amazon SageMaker Ground Truth Plus est un service d'étiquetage des données clé en main qui fait appel à une main-d'œuvre experte pour fournir rapidement des annotations de haute qualité et réduit les coûts jusqu'à 40 %. Avec SageMaker Ground Truth Plus, les scientifiques des données et les responsables d'entreprise, tels que les responsables des opérations sur les données et les gestionnaires de programmes, peuvent créer des jeux de données d'entraînement de haute qualité sans avoir à créer des applications d'étiquetage ni à gérer leurs propres équipes d'étiquetage. Vous pouvez commencer à utiliser Amazon SageMaker Ground Truth Plus en téléchargeant des données ainsi que les exigences d'étiquetage dans Amazon S3.
Pourquoi utiliser SageMaker Ground Truth Plus ?
Pour entraîner un modèle de machine learning (ML), les scientifiques des données ont besoin d'un jeu de données étiquetées volumineux et de grande qualité. À mesure que l'adoption du ML augmente, les besoins en étiquetage augmentent. Les scientifiques des données sont obligés de consacrer des semaines à la création de flux d'étiquetage des données et à la gestion d'une main-d'œuvre d'étiquetage des données. Malheureusement, cela ralentit l'innovation et augmente les coûts. Pour s'assurer de pouvoir consacrer leur temps à la création, à l'entraînement et au déploiement des modèles de ML, les scientifiques des données demandent généralement à d'autres équipes internes composées de responsables des opérations sur les données et de gestionnaires de programmes de produire des jeux de données d'entraînement de haute qualité. Toutefois, ces équipes n'ont généralement pas accès aux compétences requises pour fournir des jeux de données d'entraînement de haute qualité, ce qui affecte les résultats du ML. Une alternative consiste à rechercher un partenaire d'étiquetage des données qui peut les aider à créer des jeux de données d'entraînement de haute qualité à grande échelle sans faire appel aux ressources internes.
Lorsque vous chargez les données, SageMaker Ground Truth Plus configure les workflows d'étiquetage des données et les exploite à votre place. À partir de là, une main-d'œuvre experte et formée sur diverses tâches de machine learning (ML) effectue l'étiquetage des données. SageMaker Ground Truth Plus propose actuellement deux types de main-d'œuvre experte : une main-d'œuvre employée par Amazon et une sélection de fournisseurs tiers. SageMaker Ground Truth Plus vous offre la flexibilité nécessaire pour choisir la main-d'œuvre en matière d'étiquetage. Les experts AWS sélectionnent la meilleure main-d'œuvre en matière d'étiquetage en fonction des exigences de votre projet. Par exemple, si vous avez besoin de personnes compétentes dans l'étiquetage des fichiers audio, spécifiez-le dans les instructions fournies à SageMaker Ground Truth Plus, et le service sélectionne automatiquement les étiqueteurs possédant ces compétences.
Important
SageMaker Ground Truth Plus ne prend pas en charge les données certifiées PHI, PCI ou FedRAMP, et vous ne pouvez pas fournir ces données à SageMaker Ground Truth Plus.
Comment fonctionne SageMaker Ground Truth Plus ?
Le flux de travail comporte cinq composants principaux.
Demande d'un projet
Création d'une équipe de projet
Accès au portail du projet pour contrôler la progression des jeux de données d'entraînement et examiner les données étiquetées
Création d'un lot
Réception des données étiquetées
Comment utiliser SageMaker Ground Truth Plus ?
Si vous utilisez SageMaker Ground Truth Plus pour la première fois, démarrez avec Démarrer avec Amazon SageMaker Ground Truth Plus.. Pour accéder à SageMaker Ground Truth Plus à l’aide de la console SageMaker AI, vous devez vous trouver dans la région USA Est (Virginie du Nord) (us-east-1).