Utilizzare le regole integrate di Debugger con le impostazioni dei parametri predefinite - Amazon SageMaker AI

Utilizzare le regole integrate di Debugger con le impostazioni dei parametri predefinite

Per specificare le regole integrate di Debugger in uno strumento di valutazione, è necessario configurare un oggetto elenco. Il codice di esempio seguente mostra la struttura di base dell'elenco delle regole integrate di Debugger:

from sagemaker.debugger import Rule, rule_configs rules=[ Rule.sagemaker(rule_configs.built_in_rule_name_1()), Rule.sagemaker(rule_configs.built_in_rule_name_2()), ... Rule.sagemaker(rule_configs.built_in_rule_name_n()), ... # You can also append more profiler rules in the ProfilerRule.sagemaker(rule_configs.*()) format. ]

Per ulteriori informazioni sui valori dei parametri predefiniti e sulle descrizioni della regola integrata, consulta Elenco delle regole integrate di Debugger.

Per trovare la guida Debugger SageMaker API Reference, consulta sagemaker.debugger.rule_configs e sagemaker.debugger.Rule.

Ad esempio, per controllare le prestazioni di addestramento complessive e il progresso del modello, crea uno strumento di stima di SageMaker AI con la seguente configurazione di regole integrate.

from sagemaker.debugger import Rule, rule_configs rules=[ Rule.sagemaker(rule_configs.loss_not_decreasing()), Rule.sagemaker(rule_configs.overfit()), Rule.sagemaker(rule_configs.overtraining()), Rule.sagemaker(rule_configs.stalled_training_rule()) ]

Quando si avvia il processo di addestramento, Debugger raccoglie i dati sull'utilizzo delle risorse di sistema ogni 500 millisecondi e i valori di perdita e precisione ogni 500 passaggi per impostazione predefinita. Debugger analizza l'utilizzo delle risorse per identificare se il modello presenta problemi di collo di bottiglia. Il loss_not_decreasing, overfit, overtraining e stalled_training_rule monitora se il modello sta ottimizzando la funzione di perdita senza questi problemi di addestramento. Se le regole rilevano anomalie di addestramento, lo stato di valutazione della regola cambia in IssueFound. Puoi configurare azioni automatizzate, come la notifica dei problemi di addestramento e l'interruzione dei processi di addestramento utilizzando Eventi Amazon CloudWatch e AWS Lambda. Per ulteriori informazioni, consulta Azioni sulle regole di Amazon SageMaker Debugger.