Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Ejecución de trabajos de entrenamiento en un clúster heterogéneo
Con la característica de clúster heterogéneo de Sagemaker Training, puede ejecutar un trabajo de entrenamiento con varios tipos de instancias de ML para una mejor escalabilidad de los recursos y su utilización para diferentes tareas y propósitos de entrenamiento de ML. Por ejemplo, si su trabajo de entrenamiento en un clúster con instancias de GPU tiene un bajo uso de la GPU y problemas de cuello de botella de la CPU debido a tareas que hacen un uso intensivo de la CPU, el uso de un clúster heterogéneo puede ayudarle a reducir la carga de tareas que hacen un uso intensivo de la CPU al agregar grupos de instancias de CPU más rentables, resolver estos problemas de cuello de botella y lograr un mejor uso de la GPU.
nota
Esta característica está disponible en SageMaker Python SDK v2.110.0 y versiones posteriores.
nota
Esta característica está disponible a través de las clases de estimadores del marco de PyTorch
Consulte también el blog Improve price performance of your model training using Amazon SageMaker AI heterogeneous clusters