risoluzione dei problemi - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

risoluzione dei problemi

La sezione seguente elenca le soluzioni per la risoluzione dei problemi HyperPod in Studio.

Scheda Attività

Se visualizzi Definizione di risorse personalizzate (CRD) non configurata nel cluster quando sei nella scheda Attività.

  • Concedi le policy EKSAdminViewPolicy e ClusterAccessRole al ruolo di esecuzione del dominio.

    Per informazioni su come aggiungere tag al ruolo di esecuzione, consulta Tag IAM roles.

    Per informazioni su come collegare le policy a un utente o a un gruppo IAM, consulta Adding and removing IAM identity permissions.

Se la griglia delle attività per le metriche Slurm non smette di caricarsi nella scheda Attività.

Per la visualizzazione limitata delle attività in Studio per i cluster EKS:

  • Se il tuo ruolo di esecuzione non dispone delle autorizzazioni per elencare i namespace per i cluster EKS.

  • Se gli utenti riscontrano problemi con l’accesso ai cluster EKS.

    1. Verifica che RBAC sia abilitato eseguendo il comando seguenteAWS CLI.

      kubectl api-versions | grep rbac

      Questo dovrebbe restituire rbac.authorization.k8s.io/v1.

    2. Controlla se ClusterRole e ClusterRoleBinding esistono eseguendo i comandi seguenti.

      kubectl get clusterrole pods-events-crd-cluster-role kubectl get clusterrolebinding pods-events-crd-cluster-role-binding
    3. Verifica l’appartenenza al gruppo di utenti. Assicurati che l’utente sia assegnato correttamente al gruppo pods-events-crd-cluster-level nel tuo gestore dell’identità digitale o IAM.

  • Se l’utente non visualizza alcuna risorsa.

    • Verifica l’appartenenza al gruppo e assicurati che ClusterRoleBinding sia applicato correttamente.

  • Se gli utenti possono visualizzare le risorse in tutti i namespace.

    • Se è richiesta una limitazione del namespace, valuta la possibilità di utilizzare Role e RoleBinding invece di ClusterRole e ClusterRoleBinding.

  • Se la configurazione sembra corretta, ma le autorizzazioni non vengono applicate.

    • Controlla se NetworkPolicies o PodSecurityPolicies interferiscono con l’accesso.

Scheda dei parametri

Se non ci sono CloudWatch parametri Amazon, vengono visualizzati nella scheda Metrics.

  • La Metrics sezione dei dettagli del HyperPod cluster viene utilizzata CloudWatch per recuperare i dati. Per visualizzare le metriche in questa sezione, Osservabilità di cluster e attività deve essere abilitato. Contatta l’amministratore per configurare le metriche.