Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Notas de la versión de la biblioteca de paralelismo de datos de SageMaker AI
Consulte las siguientes notas de la versión para realizar un seguimiento de las últimas actualizaciones de la biblioteca de paralelismo de datos distribuidos de SageMaker AI (SMDDP).
La biblioteca de paralelismo de datos distribuidos de SageMaker AI v2.5.0
Fecha: 17 de octubre de 2024
Nuevas características
-
Se ha añadido compatibilidad con PyTorch v2.4.1 con CUDA v12.1.
Integración en contenedores de Docker distribuidos por la biblioteca de paralelismo de modelos de SageMaker AI (SMP)
Esta versión de la biblioteca de SMDDP se ha migrado a La biblioteca de paralelismo de modelos de SageMaker v2.6.0.
658645717510.dkr.ecr.<us-west-2>.amazonaws.com/smdistributed-modelparallel:2.4.1-gpu-py311-cu121
Para ver las regiones en las que están disponibles las imágenes de Docker de SMP, consulte Regiones de AWS.
Archivo binario de esta versión
Puede descargar o instalar la biblioteca mediante la siguiente dirección URL.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.4.1/cu121/2024-10-09/smdistributed_dataparallel-2.5.0-cp311-cp311-linux_x86_64.whl
La biblioteca de paralelismo de datos distribuidos de SageMaker AI v2.3.0
Fecha: 11 de junio de 2024
Nuevas características
-
Se ha añadido compatibilidad con PyTorch v2.3.0 con CUDA v12.1 y Python v3.11.
-
Se ha añadido compatibilidad con PyTorch Lightning v2.2.5. Se ha integrado en el contenedor de marco de SageMaker AI para PyTorch v2.3.0.
-
Se ha añadido validación de tipo de instancia en la importación para evitar que se cargue la biblioteca de SMDDP en tipos de instancia no compatibles. Para obtener una lista de los tipos de instancia compatibles con la biblioteca de SMDDP, consulte Marcos, Regiones de AWS y tipos de instancia compatibles.
Integración en contenedores de marco de SageMaker AI
Esta versión de la biblioteca de SMDDP se ha migrado al siguiente contenedor de marco de SageMaker AI
-
PyTorch v2.3.0
763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.3.0-gpu-py311-cu121-ubuntu20.04-sagemaker
Para obtener una lista completa de las versiones de la biblioteca de SMDDP y de los contenedores prediseñados, consulte Marcos, Regiones de AWS y tipos de instancia compatibles.
Archivo binario de esta versión
Puede descargar o instalar la biblioteca mediante la siguiente dirección URL.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.3.0/cu121/2024-05-23/smdistributed_dataparallel-2.3.0-cp311-cp311-linux_x86_64.whl
Otros cambios
-
La biblioteca de SMDDP v2.2.0 se ha integrado en el contenedor de marco de SageMaker AI para PyTorch v2.2.0.
La biblioteca de paralelismo de datos distribuidos de SageMaker AI v2.2.0
Fecha: 4 de marzo de 2024
Nuevas características
-
Se ha añadido compatibilidad con PyTorch v2.2.0 con CUDA v12.1.
Integración en contenedores de Docker distribuidos por la biblioteca de paralelismo de modelos de SageMaker AI (SMP)
Esta versión de la biblioteca de SMDDP se ha migrado a La biblioteca de paralelismo de modelos de SageMaker v2.2.0.
658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121
Para ver las regiones en las que están disponibles las imágenes de Docker de SMP, consulte Regiones de AWS.
Archivo binario de esta versión
Puede descargar o instalar la biblioteca mediante la siguiente dirección URL.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.2.0/cu121/2024-03-04/smdistributed_dataparallel-2.2.0-cp310-cp310-linux_x86_64.whl
La biblioteca de paralelismo de datos distribuidos de SageMaker AI v2.1.0
Fecha: 1 de marzo de 2024
Nuevas características
-
Se ha añadido compatibilidad con PyTorch v2.1.0 con CUDA v12.1.
Correcciones de errores
-
Se ha corregido el problema de pérdida de memoria de la CPU en SMDDP v2.0.1.
Integración en contenedores de marco de SageMaker AI
Esta versión de la biblioteca de SMDDP ha superado pruebas de referencia y se ha migrado al siguiente contenedor de marco de SageMaker AI
-
PyTorch v2.1.0
763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker
Integración en contenedores de Docker distribuidos por la biblioteca de paralelismo de modelos de SageMaker AI (SMP)
Esta versión de la biblioteca de SMDDP se ha migrado a La biblioteca de paralelismo de modelos de SageMaker v2.1.0.
658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121
Para ver las regiones en las que están disponibles las imágenes de Docker de SMP, consulte Regiones de AWS.
Archivo binario de esta versión
Puede descargar o instalar la biblioteca mediante la siguiente dirección URL.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.1.0/cu121/2024-02-04/smdistributed_dataparallel-2.1.0-cp310-cp310-linux_x86_64.whl
La biblioteca de paralelismo de datos distribuidos de SageMaker AI v2.0.1
Fecha: 7 de diciembre de 2023
Nuevas características
-
Se ha añadido una nueva implementación de SMDDP de operaciones colectivas
AllGatherpara los recursos de computación y la infraestructura de red de AWS. Para obtener más información, consulte Operación colectiva AllGather de SMDDP. -
La operación colectiva
AllGatherde SMDDP es compatible con PyTorch FSDP y DeepSpeed. Para obtener más información, consulte Uso de la biblioteca de SMDDP en el script de entrenamiento de PyTorch. -
Se ha añadido compatibilidad con PyTorch v2.0.1
Problemas conocidos
-
Hay un problema de pérdida de memoria de la CPU debido a un aumento gradual de la memoria de la CPU en el entrenamiento con SMDDP
AllReduceen modo DDP.
Integración en contenedores de marco de SageMaker AI
Esta versión de la biblioteca de SMDDP ha superado pruebas de referencia y se ha migrado al siguiente contenedor de marco de SageMaker AI
-
PyTorch v2.0.1
763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker
Archivo binario de esta versión
Puede descargar o instalar la biblioteca mediante la siguiente dirección URL.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.0.1/cu118/2023-12-07/smdistributed_dataparallel-2.0.2-cp310-cp310-linux_x86_64.whl
Otros cambios
-
A partir de esta versión, la documentación de la biblioteca de SMDDP está totalmente disponible en esta Guía para desarrolladores de Amazon SageMaker AI. La referencia adicional de SMDDP v1.x
de la documentación del SageMaker AI Python SDK ha quedado obsoleta en favor de esta completa guía para desarrolladores de SMDDP v2 alojada en la Guía para desarrolladores de Amazon SageMaker AI. Si sigue necesitando la documentación de SMP v1.x, consulte la siguiente instantánea de la documentación en la documentación del SageMaker Python SDK v2.212.0 .