Resolución de problemas - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Resolución de problemas

En la siguiente sección, se enumeran las soluciones de solución de problemas HyperPod en Studio.

Pestaña Tareas

Si recibe el mensaje Custom Resource Definition (CRD) is not configured on the cluster mientras está en la pestaña Tareas.

Si la cuadrícula de tareas de las métricas de Slurm no deja de cargarse en la pestaña Tareas.

Para ver las tareas restringidas en Studio para los clústeres de EKS:

  • Si su rol de ejecución no tiene permisos para enumerar los espacios de nombres de los clústeres de EKS.

  • Si los usuarios tienen problemas de acceso a los clústeres de EKS.

    1. Compruebe que el RBAC esté activado ejecutando el siguiente AWS CLI comando.

      kubectl api-versions | grep rbac

      Debería devolver rbac.authorization.k8s.io/v1.

    2. Ejecute los siguientes comandos para comprobar si existen ClusterRole y ClusterRoleBinding.

      kubectl get clusterrole pods-events-crd-cluster-role kubectl get clusterrolebinding pods-events-crd-cluster-role-binding
    3. Compruebe la pertenencia a un grupo de usuarios. Asegúrese de que el usuario esté asignado correctamente al grupo pods-events-crd-cluster-level en su proveedor de identidades o IAM.

  • Si el usuario no puede ver ningún recurso.

    • Compruebe la pertenencia al grupo y asegúrese de que ClusterRoleBinding se haya aplicado correctamente.

  • Si los usuarios pueden ver recursos en todos los espacios de nombres.

    • Si se requiere una restricción del espacio de nombres, considere usar Role y RoleBinding en lugar de ClusterRole y ClusterRoleBinding.

  • Si la configuración parece correcta, pero no se aplican los permisos.

    • Compruebe si alguna NetworkPolicies o PodSecurityPolicies interfiere con el acceso.

Pestaña Métricas

Si no hay CloudWatch estadísticas de Amazon, se muestran en la pestaña Métricas.

  • La Metrics sección de detalles del HyperPod clúster se utiliza CloudWatch para buscar los datos. Para ver las métricas de esta sección, debe estar activado Observabilidad de clústeres y tareas. Póngase en contacto con su administrador para configurar las métricas.