Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preguntas frecuentes del Compilador de entrenamiento de SageMaker
importante
Amazon Web Services (AWS) anuncia que no habrá nuevos lanzamientos o versiones del Compilador de entrenamiento de SageMaker. Puede seguir utilizando el Compilador de entrenamiento de SageMaker a través de los contenedores de aprendizaje profundo (DLC) de AWS existentes para entrenamiento de SageMaker. Es importante tener en cuenta que, si bien los DLC existentes siguen siendo accesibles, ya no recibirán parches ni actualizaciones de AWS, de acuerdo con la Política de compatibilidad del marco de contenedores de aprendizaje profundo de AWS.
Utilice los elementos de preguntas frecuentes para encontrar respuestas a las preguntas más frecuentes sobre el Compilador de entrenamiento de SageMaker.
P: ¿Cómo sé que el Compilador de entrenamiento de Sagemaker está funcionando?
Si ha iniciado correctamente su trabajo de entrenamiento con el Compilador de entrenamiento de Sagemaker, recibirá los siguientes mensajes de registro:
-
Con
TrainingCompilerConfig(debug=False)Found configuration for Training Compiler Configuring SM Training Compiler... -
Con
TrainingCompilerConfig(debug=True)Found configuration for Training Compiler Configuring SM Training Compiler... Training Compiler set to debug mode
P: ¿Qué modelos acelera el Compilador de entrenamiento de SageMaker?
El Compilador de entrenamiento Sagemaker es compatible con los modelos de aprendizaje profundo más populares de la biblioteca de transformadores Hugging Face. Con la mayoría de los operadores que admite el compilador, estos modelos se pueden entrenar más rápido con el Compilador de entrenamiento de SageMaker. Los modelos compilables incluyen, entre otros, los siguientes: bert-base-cased, bert-base-chinese, bert-base-uncased, distilbert-base-uncased, distilbert-base-uncased-finetuned-sst-2-english, gpt2, roberta-base, roberta-large, t5-base y xlm-roberta-base. El compilador funciona con la mayoría de los operadores y estructuras de datos de DL y puede acelerar muchos otros modelos de DL además de los que se han probado.
P: ¿Qué ocurre si activo el Compilador de entrenamiento de SageMaker con un modelo que no se ha probado?
En el caso de un modelo no probado, es posible que primero tenga que modificar el script de entrenamiento para que sea compatible con el Compilador de entrenamiento de SageMaker. Para obtener más información, consulte Usar un modelo de aprendizaje profundo propio y siga las instrucciones sobre cómo preparar el script de entrenamiento.
Una vez que haya actualizado el script de entrenamiento, podrá iniciar el trabajo de entrenamiento. El compilador procede a compilar el modelo. Sin embargo, es posible que la velocidad de entrenamiento no aumente e incluso disminuya en relación con la línea base con un modelo no probado. Es posible que tengas que volver a ajustar los parámetros del entrenamiento, por ejemplo, batch_size y learning_rate para conseguir algún beneficio de aceleración.
Si la compilación del modelo no probado falla, el compilador devuelve un error. Consulte Solución de problemas del Compilador de entrenamiento de SageMaker para obtener información detallada sobre los tipos de errores y los mensajes de error.
P: ¿Podré conseguir siempre un trabajo de entrenamiento más rápido con el Compilador de entrenamiento de SageMaker?
No necesariamente. En primer lugar, el compilador de entrenamiento de Sagemaker añade cierta sobrecarga de compilación antes de poder acelerar el proceso de entrenamiento continua. El trabajo de entrenamiento optimizado debe durar lo suficiente como para amortizar y compensar esta sobrecarga de compilación incremental al principio del trabajo de entrenamiento.
Además, como ocurre con cualquier modelo de proceso de entrenamiento, el entrenamiento con parámetros subóptimos puede aumentar el tiempo de entrenamiento. El Compilador de entrenamiento de SageMaker puede cambiar las características del trabajo de entrenamiento, por ejemplo, cambiando el espacio de memoria del trabajo. Debido a estas diferencias, es posible que tenga que volver a ajustar los parámetros de su trabajo de entrenamiento para acelerar el entrenamiento. Puede encontrar una tabla de referencia en la que se especifican los parámetros de mejor rendimiento para los trabajos de entrenamiento con distintos tipos y modelos de instancias enModelos probados.
Por último, parte del código de un script de entrenamiento puede añadir una sobrecarga adicional o interrumpir el gráfico de cálculo compilado y ralentizar el entrenamiento. Si trabaja con un modelo personalizado o no probado, consulte las instrucciones en Prácticas recomendadas para utilizar el Compilador de entrenamiento de SageMaker con PyTorch/XLA.
P: ¿Puedo utilizar siempre un tamaño de lote mayor con Compilador de entrenamiento de SageMaker?
El tamaño del lote aumenta en la mayoría de los casos, pero no en todos. Las optimizaciones realizadas por el Compilador de entrenamiento de SageMaker pueden cambiar las características de su trabajo de entrenamiento, como el consumo de memoria. Normalmente, un trabajo del compilador de entrenamiento ocupa menos memoria que un trabajo de entrenamiento sin compilar con el marco nativo, lo que permite un tamaño de lote mayor durante el entrenamiento. Un tamaño de lote mayor y el correspondiente ajuste de la velocidad de aprendizaje aumentan el rendimiento del entrenamiento y pueden reducir el tiempo total de entrenamiento.
Sin embargo, puede haber casos en los que el Compilador de entrenamiento de SageMaker aumente el consumo de memoria en función de su esquema de optimización. El compilador utiliza un modelo de costes analíticos para predecir el programa de ejecución con el coste de ejecución más bajo para cualquier operador que haga un uso intensivo de recursos de computación. Este modelo podría encontrar una línea de tiempo óptima que aumente el uso de la memoria. En este caso, no podrá aumentar el tamaño de los lotes, pero el rendimiento de la muestra es aún mayor.
P: ¿El compilador de entrenamiento SageMaker funciona con otras funciones de entrenamiento de SageMaker, como las bibliotecas de entrenamiento distribuidas de SageMaker AI y Depurador de SageMaker?
El Compilador de entrenamiento de SageMaker AI no es compatible actualmente con las bibliotecas de entrenamiento distribuidas de SageMaker AI.
Compilador de entrenamiento de Amazon SageMaker es compatible con el Depurador de SageMaker, pero Depurador de podría reducir el rendimiento computacional al añadir una sobrecarga.
P: ¿El Compilador de entrenamiento de Sagemaker admite contenedores personalizados (utilice su propio contenedor)?
El Compilador de entrenamiento de SageMaker se proporciona a través de contenedores de aprendizaje profundo de AWS y puede ampliar un subconjunto de contenedores para personalizarlos según su caso de uso. Los contenedores que se extienden desde los DLC de AWS son compatibles con el Compilador de entrenamiento de SageMaker. Para obtener más información, consulte Marcos compatibles y Uso del SageMaker AI Python SDK y ampliación de los contenedores de aprendizaje profundo de marco de SageMaker AI. Si necesita más ayuda, póngase en contacto con el equipo de SageMaker AI a través de AWS Soporte