Risoluzione dei problemi - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi

Importante

A partire dal 30 novembre 2023, la precedente esperienza Amazon SageMaker Studio è ora denominata Amazon SageMaker Studio Classic. La sezione seguente è specifica per l’utilizzo dell’esperienza Studio aggiornata. Per informazioni sull’utilizzo dell’applicazione Studio Classic, consulta Amazon SageMaker Studio Classic.

Importante

Le politiche IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L’autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic applicano automaticamente tag a tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente l'etichettatura, possono verificarsi errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornisci le autorizzazioni per etichettare SageMaker le risorse AI.

AWS politiche gestite per Amazon SageMaker AIche danno i permessi per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Questa sezione mostra come risolvere i problemi più comuni in Amazon SageMaker Studio.

Modalità di ripristino

La modalità di ripristino consente di accedere all’applicazione Studio quando un problema di configurazione ne impedisce il normale avvio. Fornisce un ambiente semplificato con funzionalità essenziali per aiutarti a diagnosticare e risolvere il problema.

Quando un’applicazione non viene avviata, potrebbe essere visualizzato un messaggio di errore che segnala l’accesso in modalità di ripristino per risolvere uno dei seguenti problemi di configurazione.

  • File .condarc danneggiato.

    Per informazioni sulla risoluzione dei problemi del file .condarc, consulta la pagina Troubleshooting in Conda user guide.

  • Volume di archiviazione disponibile insufficiente.

    Puoi aumentare lo spazio di archiviazione di Amazon EBS disponibile per l’applicazione o accedere alla modalità di ripristino per rimuovere i dati non necessari.

    Per informazioni su come aumentare le dimensioni del volume Amazon EBS, consulta la pagina Request a quota size in Service Quotas Developer Guide.

In modalità di ripristino:

  • La home directory avrà un aspetto diverso rispetto a quello di un normale avvio. Questa directory è temporanea e garantisce che eventuali configurazioni danneggiate nella home directory standard non influiscano sulle operazioni della modalità di ripristino. Puoi accedere alla home directory standard utilizzando il comando cd /home/sagemaker-user.

    • Modalità standard: /home/sagemaker-user

    • Modalità di ripristino: /tmp/sagemaker-recovery-mode-home

  • L’ambiente conda utilizza un ambiente conda minimo che contiene solo i pacchetti essenziali. La configurazione conda semplificata aiuta a isolare i problemi relativi all’ambiente e fornisce funzionalità di base per la risoluzione dei problemi.

Puoi utilizzare l'interfaccia utente di Studio o accedere AWS CLI all'applicazione in modalità di ripristino.

Di seguito vengono fornite istruzioni per accedere all’applicazione in modalità di ripristino.

  1. Se non lo hai già fatto, avvia l’interfaccia utente di Studio seguendo le istruzioni riportate in Avvio dalla console Amazon SageMaker AI.

  2. Dal menu di navigazione a sinistra, scegli l’applicazione in Applicazioni.

  3. Scegli lo spazio che presenta problemi di configurazione.

    Le fasi seguenti diventano disponibili quando si verificano uno o più dei problemi di configurazione menzionati in precedenza. In questo caso, verranno visualizzati un banner di avviso e un messaggio sulla modalità di ripristino.

    Nota

    Il banner di avviso dovrebbe contenere una soluzione consigliata per il problema. Prendine nota prima di procedere.

  4. Scegli Esegui lo spazio (modalità di ripristino).

  5. Per accedere all'applicazione in modalità di ripristino, scegli Apri application (modalità di ripristino).

Per accedere all'applicazione in modalità di ripristino, è necessario aggiungerla --recovery-mode al comando AWS CLI create-app. Di seguito viene fornito un esempio su come accedere all’applicazione in modalità di ripristino.

Per il seguente esempio, sono necessari:

Access Code Editor application in recovery mode
aws sagemaker create-app \ --app-name app-name \ --app-type CodeEditor \ --domain-id domain-id \ --space-name space-name \ --recovery-mode
Access JupyterLab application in recovery mode
aws sagemaker create-app \ --app-name app-name \ --app-type JupyterLab \ --domain-id domain-id \ --space-name space-name \ --recovery-mode

Impossibile eliminare l'editor di codice o l'applicazione JupyterLab

Questo problema si verifica quando un utente crea un'applicazione da Amazon SageMaker Studio, disponibile solo in Studio, quindi ripristina l'esperienza predefinita su Studio Classic. Di conseguenza, l'utente non può eliminare un'applicazione per Code Editor, basata su Code-OSS, Visual Studio Code - Open Source o JupyterLab perché non può accedere all'interfaccia utente di Studio.

Per risolvere questo problema, avvisa l'amministratore in modo che possa eliminare l'applicazione manualmente utilizzando AWS Command Line Interface ()AWS CLI.

EC2InsufficientCapacityError

Questo problema si verifica quando si tenta di gestire uno spazio e al momento AWS non è disponibile una capacità on-demand sufficiente per soddisfare la richiesta.

Per risolvere il problema, procedi come segue.

  • Attendi alcuni minuti, quindi invia di nuovo la richiesta. La capacità dell’istanza cambia frequentemente.

  • Esegui lo spazio con una dimensione o un tipo di istanza alternativi.

Nota

La capacità è fornita da più zone di disponibilità. Per massimizzare la disponibilità della capacità per gli utenti, consigliamo di configurare le sottoreti in tutte le zone di disponibilità. Studio esegue diversi tentativi in tutte le zone di disponibilità configurate per il dominio.

La disponibilità del tipo di istanza varia a seconda delle Regioni. Per un elenco dei tipi di istanze supportati per regione, consulta i prezzi di Amazon SageMaker AI)

La tabella seguente elenca le famiglie di istanze e le relative alternative consigliate.

Famiglia di istanze Tipo CPU v CPUs Memoria (GiB) Tipo GPU GPUs Memoria GPU (GiB) Alternativa consigliata
G4dn Processori Intel Xeon scalabili di seconda generazione Da 4 a 96 Da 16 a 384 NVIDIA T4 Tensor Core Da 1 a 8 16 per GPU G6
G5 Processori AMD EYPC di seconda generazione Da 4 a 192 Da 16 a 768 NVIDIA A10G Tensor Core Da 1 a 8 24 per GPU G6e
G6 Processori AMD EPYC di terza generazione Da 4 a 192 Da 16 a 768 NVIDIA L4 Tensor Core Da 1 a 8 24 per GPU G4dn
G6e Processori AMD EPYC di terza generazione Da 4 a 192 Da 32 a 1536 NVIDIA L40S Tensor Core Da 1 a 8 48 per GPU G5, P4
P3 Processori scalabili Intel Xeon Da 8 a 96 Da 61 a 768 NVIDIA Tesla V100 Da 1 a 8 16 per GPU (32 per GPU per P3dn) G6e, P4
P4 Processori Intel Xeon scalabili di seconda generazione 96 1152 NVIDIA A100 Tensor Core 8 320 (640 per P4de) G6e
P5 Processori AMD EPYC di terza generazione 192 2000 NVIDIA H100 Tensor Core 8 640 P4de

Limite insufficiente (è necessario un aumento della quota)

Questo problema si verifica quando visualizzi il messaggio di errore seguente mentre tenti di eseguire uno spazio.

Error when creating application for space: ... : The account-level service limit is X Apps, with current utilization Y Apps and a request delta of 1 Apps. Please use Quote di servizio to request an increase for this quota.

Esiste un limite predefinito, per ciascun tipo di istanza, per il numero di istanze che puoi eseguire in ogni Regione AWS. Questo errore indica che hai raggiunto tale limite.

Per risolvere questo problema, richiedi un aumento del limite di istanza per Regione AWS lo spazio in cui stai avviando lo spazio. Per ulteriori informazioni, consulta la sezione Richiesta di un aumento di quota.

Errore durante il caricamento dell’immagine personalizzata

Questo problema si verifica quando un'immagine SageMaker AI viene eliminata prima di scollegarla dal dominio. Il messaggio compare quando visualizzi la scheda Ambiente del dominio.

Per risolvere il problema, devi creare una nuova immagine temporanea con lo stesso nome di quella eliminata, scollegare l’immagine, quindi eliminare l’immagine temporanea. Utilizza le seguenti istruzioni per la procedura dettagliata.

  1. Se non l'hai già fatto, avvia la console SageMaker AI.

  2. Nel menu di navigazione a sinistra, in Configurazioni di amministrazione, scegli Domini.

  3. Scegli il tuo dominio.

  4. Scegli la scheda Ambiente. Il messaggio di errore compare in questa pagina.

  5. Copia il nome dell’immagine dall’ARN dell’immagine.

  6. Nel menu di navigazione a sinistra, in Configurazioni di amministrazione, scegli Immagini.

  7. Scegliere Create Image (Crea immagine).

  8. Segui le fasi della procedura, ma assicurati che il nome dell’immagine sia uguale a quello dell’immagine precedente.

    Se non disponi di un’immagine in una directory Amazon ECR, consulta le istruzioni in Creazione di un’immagine personalizzata e invio ad Amazon ECR.

  9. Dopo aver creato l'immagine SageMaker AI, torna alla scheda Ambiente del dominio. Viene visualizzata l’immagine collegata al dominio.

  10. Seleziona l’immagine e scegli Scollega.

  11. Segui le istruzioni per scollegare ed eliminare l'immagine SageMaker AI temporanea.