Uso de Amazon SageMaker Ground Truth Plus para etiquetar datos - Amazon SageMaker AI

Uso de Amazon SageMaker Ground Truth Plus para etiquetar datos

Amazon SageMaker Ground Truth Plus es un servicio de etiquetado de datos listo para usar que emplea personal experto para entregar anotaciones de alta calidad con rapidez y reduce los costos hasta en un 40 %. Con SageMaker Ground Truth Plus, los científicos de datos y los directivos empresariales, como los jefes de operaciones de datos y los jefes de programas, pueden crear conjuntos de datos de entrenamiento de alta calidad sin tener que crear aplicaciones de etiquetado ni gestionar el personal de etiquetado ellos mismos. Puede empezar a utilizar Amazon SageMaker Ground Truth Plus cargando los datos junto con los requisitos de etiquetado en Amazon S3.

¿Por qué usar SageMaker Ground Truth Plus?

Para entrenar un modelo de machine learning (ML), los científicos de datos necesitan un conjunto de datos grande, de alta calidad y etiquetado. A medida que crece la adopción del ML, aumentan las necesidades de etiquetado. Esto obliga a los científicos de datos a dedicar semanas a crear flujos de trabajo de etiquetado de datos y a gestionar el personal de etiquetado de datos. Lamentablemente, esto ralentiza la innovación y aumenta los costos. A fin de que los científicos de datos puedan dedicar su tiempo a crear, entrenar e implementar modelos de machine learning, suelen encargar a otros equipos internos, compuestos por jefes de operaciones de datos y jefes de programas, que produzcan conjuntos de datos de entrenamiento de alta calidad. Sin embargo, estos equipos no suelen tener acceso a las habilidades necesarias para ofrecer conjuntos de datos de entrenamiento de alta calidad, lo que afecta a los resultados del machine learning. Por lo tanto, necesitamos un socio de etiquetado de datos que pueda ayudarlos a crear conjuntos de datos de entrenamiento, de alta calidad y a escala sin consumir sus recursos internos.

Al cargar los datos, SageMaker Ground Truth Plus configura los flujos de trabajo de etiquetado de datos y los gestiona en su nombre. A partir de ahí, un personal experto y formado en una variedad de tareas de machine learning (ML) realiza el etiquetado de los datos. SageMaker Ground Truth Plus ofrece actualmente dos tipos de personal experto: una fuerza laboral empleada por Amazon y una lista seleccionada de proveedores externos. SageMaker Ground Truth Plus le ofrece la flexibilidad de elegir el personal de etiquetado. Los expertos de AWS seleccionan al mejor personal de etiquetado en función de los requisitos de su proyecto. Por ejemplo, si necesita personas con experiencia en el etiquetado de archivos de audio, especifíquelo en las directrices proporcionadas a SageMaker Ground Truth Plus y el servicio seleccionará automáticamente a los etiquetadores que posean esas habilidades.

importante

SageMaker Ground Truth Plus no admite datos certificados por PHI, PCI o FedRAMP, y no debe proporcionar estos datos a SageMaker Ground Truth Plus.

¿Cómo funciona SageMaker Ground Truth Plus?

Un flujo de trabajo consta de cinco componentes principales.

  • Solicitud de un proyecto

  • Creación de un proyecto

  • Acceso al portal de proyectos para supervisar el progreso de los conjuntos de datos de entrenamiento y revisar los datos etiquetados

  • Creación de un lote

  • Recepción de los datos etiquetados

¿Cómo uso SageMaker Ground Truth Plus?

Si es la primera vez que usa SageMaker Ground Truth Plus, utilice Introducción a Amazon SageMaker Ground Truth Plus. para empezar. Para acceder a SageMaker Ground Truth Plus mediante la consola de SageMaker AI, debe estar en Este de EE. UU. (Norte de Virginia) (us-east-1).