Amazon SageMaker Profiler - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon SageMaker Profiler

Amazon SageMaker Profiler è attualmente in versione di anteprima ed è disponibile gratuitamente nelle Regioni AWS supportate. La versione generalmente disponibile di Amazon SageMaker Profiler (se presente) può includere funzionalità e prezzi diversi da quelli offerti in anteprima.

Amazon SageMaker Profiler è una funzionalità di Amazon SageMaker AI che offre una visualizzazione dettagliata delle risorse di calcolo AWS allocate durante l’addestramento dei modelli di deep learning su SageMaker AI. Si concentra sulla profilazione dell’utilizzo di CPU e GPU, le esecuzioni del kernel sulle GPU, i lanci del kernel sulle CPU, le operazioni di sincronizzazione, le operazioni sulla memoria tra CPU e GPU, le latenze tra i lanci del kernel e le esecuzioni corrispondenti e il trasferimento di dati tra CPU e GPU. SageMaker Profiler offre anche un’interfaccia utente (UI) che visualizza il profilo, un riepilogo statistico degli eventi profilati e la meline di un job di addestramento per monitorare e comprendere la relazione temporale degli eventi tra GPU e CPU.

Nota

SageMaker Profiler supporta PyTorch e TensorFlow ed è disponibile nei container AWS per il deep learning per SageMaker AI. Per ulteriori informazioni, consulta Immagini del framework supportate, Regioni AWS e tipi di istanze.

Per i data scientist

L’addestramento di modelli di deep learning su un cluster di elaborazione di grandi dimensioni presenta spesso dei problemi di ottimizzazione computazionale, come colli di bottiglia, latenze di avvio del kernel, limiti di memoria e basso utilizzo delle risorse.

Per identificare tali problemi di prestazioni computazionali, è necessario analizzare più a fondo le risorse di calcolo per comprendere quali kernel introducono latenze e quali operazioni causano colli di bottiglia. I data scientist possono trarre vantaggio dall’utilizzo dell’interfaccia utente di SageMaker Profiler per visualizzare il profilo dettagliato dei job di addestramento. L’interfaccia utente fornisce un pannello di controllo dotato di grafici di riepilogo e un’interfaccia timeline per tenere traccia di ogni evento sulle risorse di calcolo. I data scientist possono inoltre aggiungere annotazioni personalizzate per tenere traccia di alcune parti del job di addestramento utilizzando i moduli Python di SageMaker Profiler.

Per gli amministratori

Tramite la pagina di destinazione del Profiler nella console SageMaker AI o nel dominio SageMaker AI, puoi gestire gli utenti dell’applicazione Profiler se sei amministratore di un account AWS o di un dominio SageMaker AI. Ogni utente del dominio può accedere alla propria applicazione Profiler con le autorizzazioni concesse. In qualità di amministratore del dominio SageMaker AI e utente del dominio, puoi creare ed eliminare l’applicazione Profiler in base al livello di autorizzazione di cui disponi.