Framework e algoritmi supportati - Amazon SageMaker AI

Framework e algoritmi supportati

La tabella seguente mostra i framework e gli algoritmi di machine learning di SageMaker AI supportati da Debugger.

SageMaker AI-supported frameworks and algorithms Debugging output tensors

TensorFlow

Container di deep learning AWS TensorFlow 1.15.4 o versioni successive

PyTorch

Container di deep learning AWS Pytorch 1.5.0 o versioni successive

MXNet

Container di deep learning AWS MXnet 1.6.0 o versioni successive

XGBoost

1.0-1, 1.2-1, 1.3-1

Strumento di stima SageMaker AI generico

Container di addestramento personalizzati (disponibili per TensorFlow, Pytorch, MXNet e XGBoost con registrazione manuale degli hook)

  • Debug dei tensori di output: monitora ed esegui il debug dei parametri del modello, come pesi, gradienti, distorsioni e valori scalari, del tuo processo di addestramento. I framework di deep learning disponibili sono Apache MXNet, TensorFlow, PyTorch e XGBoost.

    Importante

    Per il framework TensorFlow con Keras, Debugger SageMaker rende obsoleto il supporto a zero modifiche del codice per i modelli di debug creati utilizzando i moduli tf.keras di TensorFlow 2.6 e versioni successive. Ciò è dovuto alle modifiche rivoluzionarie annunciate nella nota di rilascio di TensorFlow 2.6.0. Per istruzioni su come aggiornare lo script di addestramento, consulta Adattare uno script di addestramento TensorFlow.

    Importante

    A partire da PyTorch v1.12.0 e versioni successive, Debugger SageMaker rende obsoleto il supporto a zero modifiche del codice per i modelli di debug.

    Ciò è dovuto a modifiche rivoluzionarie che causano l'interferenza di Debugger SageMaker con la funzionalità torch.jit. Per istruzioni su come aggiornare lo script di addestramento, consulta Adatta il tuo script di addestramento PyTorch.

Se il framework o l'algoritmo che desideri addestrare e di cui desideri eseguire il debug non è elencato nella tabella, vai al Forum di discussione AWS e lascia un feedback su Debugger SageMaker.

Regioni AWS

Amazon SageMaker Debugger è disponibile in tutte le Regioni in cui Amazon SageMaker AI è in servizio, ad eccezione della Regione indicata di seguito.

  • Asia Pacifico (Giacarta): ap-southeast-3

Per scoprire se Amazon SageMaker AI è in servizio nella tua Regione AWS, consulta Servizi regionali AWS.

Uso di Debugger con container di addestramento personalizzati

Introduci i tuoi container di addestramento in SageMaker AI e ottieni informazioni dettagliate sui tuoi job di addestramento utilizzando Debugger. Massimizza la tua efficienza lavorativa ottimizzando il tuo modello sulle istanze Amazon EC2 utilizzando le funzionalità di monitoraggio e debug.

Per ulteriori informazioni su come creare un container di addestramento con la libreria client sagemaker-debugger, inviarlo ad Amazon Elastic Container Registry (Amazon ECR) e monitorare ed eseguire il debug, consulta Utilizzo di Debugger con container di addestramento personalizzati.

Repository GitHub open source di Debugger

Le API Debugger sono fornite tramite SageMaker Python SDK e progettate per creare configurazioni di hook e regole di Debugger per le operazioni API SageMaker AI CreateTrainingJob e DescribeTrainingJob. La libreria client sagemaker-debugger fornisce strumenti per registrare gli hook e accedere ai dati di addestramento tramite la sua funzionalità di prova, il tutto tramite le sue operazioni API flessibili e potenti. Supporta i framework di machine learning TensorFlow, PyTorch, MxNet e XGBoost su Python 3.6 e versioni successive.

Per risorse dirette su Debugger e sulle operazioni API sagemaker-debugger, consulta i collegamenti seguenti:

Se utilizzi l'SDK for Java per condurre processi di addestramento su SageMaker e desideri configurare le API Debugger, consulta i seguenti riferimenti: