TensorBoard in Amazon SageMaker AI - Amazon SageMaker AI

TensorBoard in Amazon SageMaker AI

Amazon SageMaker AI con TensorBoard è una funzionalità di Amazon SageMaker AI che trasferisce gli strumenti di visualizzazione di TensorBoard in SageMaker AI, integrati in SageMaker Training e nel dominio. Fornisce le opzioni per amministrare l’account AWS e gli utenti che appartengono all’account tramite il dominio SageMaker AI, per consentire agli utenti del dominio di accedere ai dati TensorBoard con le autorizzazioni appropriate per Amazon S3 e aiutare gli utenti del dominio a eseguire attività di debug dei modelli tramite i plug-in di visualizzazione TensorBoard. SageMaker AI con TensorBoard è esteso con il plug-in SageMaker AI Data Manager, con il quale gli utenti del dominio possono accedere a una serie di job di addestramento in un’unica posizione all’interno dell’applicazione TensorBoard.

Nota

Questa funzionalità consente di eseguire il debug dell’addestramento dei modelli di deep learning utilizzando PyTorch o TensorFlow.

Per i data scientist

L'addestramento di modelli di grandi dimensioni può comportare problemi scientifici che richiedono ai data scientist di eseguire il debug e risolverli per migliorare la convergenza dei modelli e stabilizzare i processi di discesa del gradiente.

Quando si verificano problemi di addestramento dei modelli, come la perdita, la mancata convergenza, la scomparsa o l'esplosione di pesi e sfumature, è necessario accedere ai dati tensoriali per approfondire e analizzare i parametri del modello, gli scalari e qualsiasi parametro personalizzato. Utilizzando SageMaker AI con TensorBoard, è possibile visualizzare i tensori di output dei modelli estratti dai job di addestramento. Mentre sperimenti diversi modelli, più sessioni di addestramento e iperparametri del modello, puoi selezionare più processi di addestramento in TensorBoard e confrontarli in un unico posto.

Per gli amministratori

Tramite la pagina di destinazione di TensorBoard nella console SageMaker AI o nel dominio SageMaker AI, gli amministratori di un account AWS o di un dominio SageMaker AI possono gestire gli utenti dell’applicazione TensorBoard. Ogni utente del dominio può accedere alla propria applicazione TensorBoard con le autorizzazioni concesse. Gli amministratori del dominio SageMaker AI e gli utenti del dominio possono creare ed eliminare l’applicazione TensorBoard in base al livello di autorizzazione assegnato.

Nota

Non è possibile condividere l’applicazione TensorBoard per scopi di collaborazione, in quanto il dominio SageMaker AI non consente la condivisione delle applicazioni tra gli utenti. Gli utenti possono condividere i tensori di output salvati in un bucket S3, se hanno accesso al bucket.

Framework supportati e Regioni AWS

L’applicazione TensorBoard in SageMaker AI è disponibile per i seguenti framework di machine learning e le seguenti Regioni AWS.

Framework
  • PyTorch

  • TensorFlow

  • Trasformatori Hugging Face

Regioni AWS
  • Stati Uniti orientali (Virginia settentrionale) (us-east-1)

  • Stati Uniti orientali (Ohio) (us-east-2)

  • Stati Uniti occidentali (Oregon) (us-west-2)

  • Europa (Francoforte) (eu-central-1)

  • Europa (Irlanda) (eu-west-1)

Nota

La funzionalità Amazon SageMaker AI con TensorBoard viene eseguita su un’istanza ml.r5.large e comporta costi dopo il piano gratuito di SageMaker AI o il periodo di prova gratuito della funzionalità. Per ulteriori informazioni, consulta Prezzi di Amazon SageMaker AI.