Controller del pannello di controllo di Approfondimenti su Debugger Amazon SageMaker - Amazon SageMaker AI

Controller del pannello di controllo di Approfondimenti su Debugger Amazon SageMaker

Esistono diversi componenti del controller di Debugger per il monitoraggio e la profilazione. In questa guida, imparerai a conoscere i componenti del controller di Debugger.

Nota

La dashboard degli approfondimenti di SageMaker Debugger esegue un’app Studio Classic su un’istanza ml.m5.4xlarge per elaborare ed eseguire il rendering delle visualizzazioni. Ogni scheda di Approfondimenti su SageMaker Debugger esegue una sessione del kernel di Studio Classic. Più sessioni del kernel per più schede di Approfondimenti su Debugger SageMaker vengono eseguite sulla singola istanza. Quando si chiude una scheda di Approfondimenti su Debugger SageMaker, viene chiusa anche la sessione del kernel corrispondente. L’app Studio Classic rimane attiva e addebita i costi per l’utilizzo dell’istanza ml.m5.4xlarge. Per informazioni sui prezzi, consultare la pagina Prezzi di Amazon SageMaker.

Importante

Quando hai finito di usare il pannello di controllo Approfondimenti su Debugger SageMaker, arresta l'istanza ml.m5.4xlarge per evitare addebiti. Per istruzioni sulla modalità di arresto di un'istanza, consultare Arresto dell'istanza Approfondimenti su Debugger Amazon SageMaker.

Interfaccia utente del controller di Approfondimenti su Debugger SageMaker

Utilizzando il controller di Debugger situato nell'angolo superiore sinistro del pannello di controllo delle Informazioni, è possibile aggiornare il pannello di controllo, configurare o aggiornare le impostazioni di Debugger per il monitoraggio delle metriche del sistema, interrompere un processo di addestramento e scaricare un rapporto di profilazione di Debugger.

Controller del pannello di controllo Approfondimenti su Debugger SageMaker
  • Se desideri aggiornare manualmente il pannello di controllo, scegli il pulsante di aggiornamento (la freccia rotonda nell'angolo in alto a sinistra) come mostrato nello screenshot precedente.

  • L'interruttore attiva/disattiva Monitoraggio è attivo in base all’impostazione predefinita per qualsiasi processo di addestramento SageMaker avviato utilizzando Python SDK SageMaker. Se non è attivato, è possibile utilizzare il pulsante di attivazione/disattivazione per avviare il monitoraggio. Durante il monitoraggio, Debugger raccoglie solo i parametri di utilizzo delle risorse per rilevare problemi computazionali come i colli di bottiglia della CPU e il sottoutilizzo della GPU. Per un elenco completo dei problemi di utilizzo delle risorse monitorate da Debugger, consulta Regole integrate di Debugger per la profilazione dell’utilizzo delle risorse del sistema hardware (parametri di sistema).

  • Il pulsante Configura monitoraggio apre una finestra pop-up che puoi utilizzare per impostare o aggiornare la frequenza di raccolta dei dati e il percorso S3 per salvare i dati.

    La finestra pop-up per la configurazione delle impostazioni di monitoraggio di Debugger

    È possibile specificare i valori per i seguenti campi.

    • URI del bucket S3:Specifica l’URI del bucket S3 di base.

    • Raccogli i dati di monitoraggio ogni: seleziona un intervallo di tempo per raccogliere le metriche di sistema. Puoi scegliere uno degli intervalli di monitoraggio dall'elenco a discesa. Gli intervalli disponibili sono 100 millisecondi, 200 millisecondi, 500 millisecondi (impostazione predefinita), 1 secondo, 5 secondi e 1 minuto.

      Nota

      Se scegli uno degli intervalli di tempo più bassi, aumenti la granularità delle metriche di utilizzo delle risorse, in modo da poter rilevare picchi e anomalie con una risoluzione temporale più elevata. Tuttavia, maggiore è la risoluzione, maggiore è la dimensione delle metriche di sistema da elaborare. Ciò potrebbe comportare costi generali aggiuntivi e influire sui tempi complessivi di addestramento ed elaborazione.

  • Utilizzando il pulsante Arresta addestramento, è possibile interrompere il processo di addestramento quando si riscontrano anomalie nell'utilizzo delle risorse.

  • Utilizzando il pulsante Scarica rapporto, è possibile scaricare un report di profilazione aggregato utilizzando la regola ProfilerReport dei Debugger SageMaker. Il pulsante si attiva quando si aggiunge la regola ProfilerReport integrata allo strumento di valutazione. Per ulteriori informazioni, vedere Configurazione delle regole integrate del profiler e Profilazione del report generato utilizzando Debugger SageMaker.