Características principales de la biblioteca de paralelismo de modelos de SageMaker v2
La biblioteca de paralelismo de modelos de Amazon SageMaker AI v2 (SMP v2) ofrece estrategias de distribución y técnicas de ahorro de memoria, como el paralelismo de datos particionados, el paralelismo de tensores y los puntos de comprobación. Las estrategias y técnicas de paralelismo de modelos que ofrece SMP v2 ayudan a distribuir modelos grandes en varios dispositivos, a la vez que optimizan la velocidad de entrenamiento y el consumo de memoria. SMP v2 también proporciona un paquete de Python torch.sagemaker para ayudar a adaptar el script de entrenamiento con pocos cambios en las líneas de código.
Esta guía sigue el flujo básico de dos pasos introducido en Uso de la biblioteca de paralelismo de modelos de SageMaker v2. Para profundizar en las características principales de SMP v2 y cómo usarlas, consulte los siguientes temas.
nota
Estas características principales están disponibles en SMP v2.0.0 y versiones posteriores y en el SageMaker Python SDK v2.200.0 y posteriores, y funcionan para PyTorch v2.0.1 y versiones posteriores. Para comprobar las versiones de los paquetes, consulte Marcos y Regiones de AWS compatibles.