Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Funcionamiento de la selección inteligente de SageMaker
El objetivo de la selección inteligente de SageMaker es seleccionar los datos de entrenamiento durante el proceso de entrenamiento y enviar solo las muestras más informativas al modelo. Durante un entrenamiento típico con PyTorch, DataLoader de PyTorch
En el siguiente diagrama se muestra información general sobre cómo se diseña el algoritmo de selección inteligente de SageMaker.
En resumen, la selección inteligente de SageMaker funciona durante el entrenamiento a medida que se cargan los datos. El algoritmo de selección inteligente de SageMaker calcula las pérdidas en los lotes y refina los datos que no mejoran antes de la pasada hacia adelante y hacia atrás de cada iteración. A continuación, el lote de datos refinado se utiliza para la pasada hacia delante y hacia atrás.
nota
La selección inteligente de los datos en SageMaker AI utiliza pasadas hacia adelante adicionales para analizar y filtrar los datos de entrenamiento. A su vez, hay menos pasadas hacia atrás, ya que los datos menos impactantes se excluyen de su trabajo de entrenamiento. Por este motivo, los modelos que tienen pasadas hacia atrás largas o caras obtienen los mayores beneficios de eficiencia cuando utilizan la selección inteligente. Por otro lado, si la pasada hacia delante del modelo tarda más que la pasada hacia atrás, la sobrecarga podría aumentar el tiempo total de entrenamiento. Para medir el tiempo empleado en cada pasada, puede realizar un trabajo de entrenamiento de piloto y recopilar registros que registren el tiempo que tardan los procesos. Considere también la posibilidad de utilizar el Generador de perfiles de SageMaker, que proporciona herramientas de generación de perfiles y una aplicación de interfaz de usuario. Para obtener más información, consulte Generador de perfiles de Amazon SageMaker.
La selección inteligente de SageMaker funciona para trabajos de entrenamiento basados en PyTorch con el clásico paralelismo de datos distribuidos, que hace réplicas de modelos en cada nodo de trabajo de GPU y realiza la operación AllReduce. Funciona con DDP de PyTorch y con la biblioteca de paralelismo de datos distribuidos de SageMaker AI.