Funcionamiento de la clasificación de imágenes - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Funcionamiento de la clasificación de imágenes

El algoritmo de clasificación de imágenes toma una imagen como entrada y la clasifica en una de las categorías de salida. El aprendizaje profundo ha revolucionado el dominio de clasificación de imágenes y ha conseguid un desempeño fantástico. Se han desarrollado distintas redes de aprendizaje profundo, como ResNet, DenseNet, Inception, etc., que son muy precisas en la clasificación de imágenes. Al mismo tiempo, se han adoptado medidas para recopilar los datos de imágenes etiquetados que son esenciales para la capacitación de estas redes. ImageNet es uno de esos conjuntos de datos de gran tamaño, con más de 11 millones de imágenes y aproximadamente 11 000 categorías. Una vez que se realiza la capacitación de una red con datos ImageNet, puede utilizarse para la generalización también con otros conjuntos de datos mediante reajustes sencillos. En este enfoque de aprendizaje de transferencia, se inicializa una red con ponderaciones (en este ejemplo, con capacitación en ImageNet), que pueden refinarse más adelante para una tarea de clasificación de imágenes en un conjunto de datos diferente.

La clasificación de imágenes en Amazon SageMaker AI se puede ejecutar en dos modos: entrenamiento completo y aprendizaje por transferencia. En el modo de capacitación completo, la red se inicializa con ponderaciones aleatorias y se capacita en los datos de usuario desde cero. En el modo de aprendizaje de transferencia, la red se inicializa con ponderaciones con capacitación previa y solo la capa superior conectada totalmente se inicializa con ponderaciones aleatorias. Después, toda la red se refina con los nuevos datos. En este modo, la capacitación puede lograrse incluso con conjuntos de datos más pequeños. Esto se debe a que ya se ha realizado la capacitación de la red y, por lo tanto, puede utilizarse en casos sin datos de capacitación suficientes.