Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Note di rilascio della libreria SageMaker AI Distributed Data Parallelism
Consulta le seguenti note di rilascio per tenere traccia degli ultimi aggiornamenti per la libreria SageMaker AI Distributed Data Parallelism (SMDDP).
Libreria SageMaker AI Distributed Data Parallelism v2.5.0
Data: 17 ottobre 2024
Nuove funzionalità
-
Aggiunto il supporto per PyTorch v2.4.1 con CUDA v12.1.
Integrazione nei container Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)
Questa versione della libreria SMDDP è stata migrata a Libreria SageMaker Model Parallelism v2.6.0.
658645717510.dkr.ecr.<us-west-2>.amazonaws.com/smdistributed-modelparallel:2.4.1-gpu-py311-cu121
Per le Regioni in cui sono disponibili le immagini Docker SMP, consulta Regioni AWS.
File binario di questa versione
È possibile scaricare o installare la libreria utilizzando l’URL seguente.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.4.1/cu121/2024-10-09/smdistributed_dataparallel-2.5.0-cp311-cp311-linux_x86_64.whl
Libreria SageMaker AI Distributed Data Parallelism v2.3.0
Data: 11 giugno 2024
Nuove funzionalità
-
Aggiunto il supporto per PyTorch v2.3.0 con CUDA v12.1 e Python v3.11.
-
Aggiunto il supporto per PyTorch Lightning v2.2.5. È integrata nel container framework di SageMaker AI per PyTorch v2.3.0.
-
Aggiunta la convalida del tipo di istanza durante l’importazione per impedire il caricamento della libreria SMDDP su tipi di istanza non supportati. Per un elenco dei tipi di istanza compatibili con la libreria SMDDP, consulta Framework, Regioni AWS e tipi di istanze supportati.
Integrazione nei container framework di SageMaker AI
Questa versione della libreria SMDDP è stata migrata al seguente container framework di SageMaker AI
-
PyTorch v2.3.0
763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.3.0-gpu-py311-cu121-ubuntu20.04-sagemaker
Per un elenco completo delle versioni della libreria SMDDP e dei container predefiniti, consulta Framework, Regioni AWS e tipi di istanze supportati.
File binario di questa versione
È possibile scaricare o installare la libreria utilizzando l’URL seguente.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.3.0/cu121/2024-05-23/smdistributed_dataparallel-2.3.0-cp311-cp311-linux_x86_64.whl
Altre modifiche
-
La libreria SMDDP v2.2.0 è integrata nel container framework di SageMaker AI per PyTorch v2.2.0.
Libreria SageMaker AI Distributed Data Parallelism v2.2.0
Data: 4 marzo 2024
Nuove funzionalità
-
Aggiunto il supporto per PyTorch v2.2.0 con CUDA v12.1.
Integrazione nei container Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)
Questa versione della libreria SMDDP è stata migrata a Libreria SageMaker Model Parallelism v2.2.0.
658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121
Per le Regioni in cui sono disponibili le immagini Docker SMP, consulta Regioni AWS.
File binario di questa versione
È possibile scaricare o installare la libreria utilizzando l’URL seguente.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.2.0/cu121/2024-03-04/smdistributed_dataparallel-2.2.0-cp310-cp310-linux_x86_64.whl
Libreria SageMaker AI Distributed Data Parallelism v2.1.0
Data: 1° marzo 2024
Nuove funzionalità
-
Aggiunto il supporto per PyTorch v2.1.0 con CUDA v12.1.
Correzioni di bug
-
Risolto il problema di perdita di memoria della CPU in SMDDP v2.0.1.
Integrazione nei container framework di SageMaker AI
Questa versione della libreria SMDDP ha superato i test di benchmark ed è stata migrata al seguente container framework di SageMaker AI
-
PyTorch v2.1.0
763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker
Integrazione nei container Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)
Questa versione della libreria SMDDP è stata migrata a Libreria SageMaker Model Parallelism v2.1.0.
658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121
Per le Regioni in cui sono disponibili le immagini Docker SMP, consulta Regioni AWS.
File binario di questa versione
È possibile scaricare o installare la libreria utilizzando l’URL seguente.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.1.0/cu121/2024-02-04/smdistributed_dataparallel-2.1.0-cp310-cp310-linux_x86_64.whl
Libreria SageMaker AI Distributed Data Parallelism v2.0.1
Data: 7 dicembre 2023
Nuove funzionalità
-
Aggiunta una nuova implementazione SMDDP dell’operazione collettiva
AllGatherottimizzata per le risorse di calcolo AWS e l’infrastruttura di rete. Per ulteriori informazioni, consulta Operazione collettiva AllGather SMDDP. -
L’operazione collettiva
AllGatherSMDDP è compatibile con PyTorch FSDP e DeepSpeed. Per ulteriori informazioni, consulta Utilizzare la libreria SMDDP in uno script di addestramento PyTorch. -
Aggiunto il supporto per PyTorch v2.0.1
Problemi noti
-
Si verifica un problema di perdita di memoria della CPU a causa di un aumento graduale della memoria della CPU durante l’addestramento con
AllReduceSMDDP in modalità DDP.
Integrazione nei container framework di SageMaker AI
Questa versione della libreria SMDDP ha superato i test di benchmark ed è stata migrata al seguente container framework di SageMaker AI
-
PyTorch v2.0.1
763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker
File binario di questa versione
È possibile scaricare o installare la libreria utilizzando l’URL seguente.
https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.0.1/cu118/2023-12-07/smdistributed_dataparallel-2.0.2-cp310-cp310-linux_x86_64.whl
Altre modifiche
-
A partire da questa versione, la documentazione per la libreria SMDDP è disponibile per intero in questa Guida per gli sviluppatori di Amazon SageMaker AI. Con l’introduzione della guida completa per gli sviluppatori per SMDDP v2 contenuta nella Guida per gli sviluppatori di Amazon SageMaker AI, la documentazione per il riferimento aggiuntivo per SMDDP v1.x
nella documentazione di SageMaker AI Python SDK non è più supportata. Se hai ancora bisogno della documentazione per SMP v1.x, consulta il seguente snapshot nella documentazione di SageMaker Python SDK v2.212.0 .