Framework e algoritmi supportati
La tabella seguente mostra i framework e gli algoritmi di machine learning di SageMaker AI supportati da Debugger.
| SageMaker AI-supported frameworks and algorithms | Debugging output tensors |
|---|---|
|
Container di deep learning AWS TensorFlow |
|
|
Container di deep learning AWS Pytorch |
|
|
Container di deep learning AWS MXnet |
|
|
1.0-1, 1.2-1, 1.3-1 |
|
|
Container di addestramento personalizzati (disponibili per TensorFlow, Pytorch, MXNet e XGBoost con registrazione manuale degli hook) |
-
Debug dei tensori di output: monitora ed esegui il debug dei parametri del modello, come pesi, gradienti, distorsioni e valori scalari, del tuo processo di addestramento. I framework di deep learning disponibili sono Apache MXNet, TensorFlow, PyTorch e XGBoost.
Importante
Per il framework TensorFlow con Keras, Debugger SageMaker rende obsoleto il supporto a zero modifiche del codice per i modelli di debug creati utilizzando i moduli
tf.kerasdi TensorFlow 2.6 e versioni successive. Ciò è dovuto alle modifiche rivoluzionarie annunciate nella nota di rilascio di TensorFlow 2.6.0. Per istruzioni su come aggiornare lo script di addestramento, consulta Adattare uno script di addestramento TensorFlow. Importante
A partire da PyTorch v1.12.0 e versioni successive, Debugger SageMaker rende obsoleto il supporto a zero modifiche del codice per i modelli di debug.
Ciò è dovuto a modifiche rivoluzionarie che causano l'interferenza di Debugger SageMaker con la funzionalità
torch.jit. Per istruzioni su come aggiornare lo script di addestramento, consulta Adatta il tuo script di addestramento PyTorch.
Se il framework o l'algoritmo che desideri addestrare e di cui desideri eseguire il debug non è elencato nella tabella, vai al Forum di discussione AWS
Regioni AWS
Amazon SageMaker Debugger è disponibile in tutte le Regioni in cui Amazon SageMaker AI è in servizio, ad eccezione della Regione indicata di seguito.
Asia Pacifico (Giacarta):
ap-southeast-3
Per scoprire se Amazon SageMaker AI è in servizio nella tua Regione AWS, consulta Servizi regionali AWS
Uso di Debugger con container di addestramento personalizzati
Introduci i tuoi container di addestramento in SageMaker AI e ottieni informazioni dettagliate sui tuoi job di addestramento utilizzando Debugger. Massimizza la tua efficienza lavorativa ottimizzando il tuo modello sulle istanze Amazon EC2 utilizzando le funzionalità di monitoraggio e debug.
Per ulteriori informazioni su come creare un container di addestramento con la libreria client sagemaker-debugger, inviarlo ad Amazon Elastic Container Registry (Amazon ECR) e monitorare ed eseguire il debug, consulta Utilizzo di Debugger con container di addestramento personalizzati.
Repository GitHub open source di Debugger
Le API Debugger sono fornite tramite SageMaker Python SDK e progettate per creare configurazioni di hook e regole di Debugger per le operazioni API SageMaker AI CreateTrainingJob e DescribeTrainingJob. La libreria client sagemaker-debugger fornisce strumenti per registrare gli hook e accedere ai dati di addestramento tramite la sua funzionalità di prova, il tutto tramite le sue operazioni API flessibili e potenti. Supporta i framework di machine learning TensorFlow, PyTorch, MxNet e XGBoost su Python 3.6 e versioni successive.
Per risorse dirette su Debugger e sulle operazioni API sagemaker-debugger, consulta i collegamenti seguenti:
Se utilizzi l'SDK for Java per condurre processi di addestramento su SageMaker e desideri configurare le API Debugger, consulta i seguenti riferimenti: