Uso de reglas integradas del depurador con los ajustes de parámetros predeterminados - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de reglas integradas del depurador con los ajustes de parámetros predeterminados

Para especificar las reglas integradas del depurador en un estimador, debe configurar un objeto de la lista. El siguiente código de ejemplo muestra la estructura básica de la lista de las reglas integradas del depurador:

from sagemaker.debugger import Rule, rule_configs rules=[ Rule.sagemaker(rule_configs.built_in_rule_name_1()), Rule.sagemaker(rule_configs.built_in_rule_name_2()), ... Rule.sagemaker(rule_configs.built_in_rule_name_n()), ... # You can also append more profiler rules in the ProfilerRule.sagemaker(rule_configs.*()) format. ]

Para obtener más información sobre los valores de los parámetros predeterminados y las descripciones de la regla integrada, consulteLista de reglas integradas del depurador.

Para encontrar la referencia de la API del depurador de SageMaker consulte sagemaker.debugger.rule_configs y sagemaker.debugger.Rule.

Por ejemplo, para inspeccionar el rendimiento general del entrenamiento y el progreso del modelo, construya un estimador SageMaker AI con la siguiente configuración de reglas integradas.

from sagemaker.debugger import Rule, rule_configs rules=[ Rule.sagemaker(rule_configs.loss_not_decreasing()), Rule.sagemaker(rule_configs.overfit()), Rule.sagemaker(rule_configs.overtraining()), Rule.sagemaker(rule_configs.stalled_training_rule()) ]

Al iniciar el trabajo de entrenamiento, el depurador recopila los datos de utilización de los recursos del sistema cada 500 milisegundos y los valores de pérdida y precisión cada 500 pasos de forma predeterminada. El depurador analiza la utilización de los recursos para identificar si su modelo tiene problemas de cuellos de botella. El loss_not_decreasing, overfit, overtraining y stalled_training_rule monitoriza si su modelo está optimizando la función de pérdida sin esos problemas de entrenamiento. Si las reglas detectan anomalías en el entrenamiento, el estado de evaluación de la regla cambia a IssueFound. Puede configurar acciones automatizadas, como notificar problemas de entrenamiento y detener los trabajos de entrenamiento mediante Eventos de Amazon CloudWatch y AWS Lambda. Para obtener más información, consulte Reglas de Action on Amazon SageMaker Debugger.