Entrenamiento distribuido con la biblioteca de paralelismo de datos distribuidos de SageMaker AI - Amazon SageMaker AI

Entrenamiento distribuido con la biblioteca de paralelismo de datos distribuidos de SageMaker AI

La biblioteca de paralelismo de datos distribuidos de SageMaker AI (SMDDP) está diseñada para facilitar su uso y proporcionar integración perfecta con PyTorch.

Al entrenar un modelo de aprendizaje profundo con la biblioteca de SMDDP en SageMaker AI puede centrarse en escribir un script de entrenamiento y el entrenamiento del modelo.

Para empezar, importe la biblioteca de SMDDP para utilizar sus operaciones colectivas optimizadas para AWS. En los temas siguientes se proporcionan instrucciones sobre qué añadir al script de entrenamiento en función de la operación colectiva que desee optimizar.