Actualización del software de la plataforma de SageMaker HyperPod
Al crear el clúster de SageMaker HyperPod, SageMaker HyperPod selecciona una imagen de máquina de Amazon (AMI) correspondiente a la versión de Kubernetes del clúster de Amazon EKS.
Ejecute update-cluster-software para actualizar los clústeres existentes con el software y los parches de seguridad proporcionados por el servicio de SageMaker HyperPod. En --cluster-name, especifique el nombre o el ARN del clúster que desea actualizar.
importante
-
Cuando se llama a esta API, SageMaker HyperPod no drena ni redistribuye los trabajos (pods) que se ejecutan en los nodos. Asegúrese de comprobar si hay algún trabajo en ejecución en los nodos antes de llamar a esta API.
-
El proceso de aplicación de parches reemplaza el volumen raíz por la AMI actualizada, lo que significa que se perderán los datos anteriores almacenados en el volumen raíz de la instancia. Asegúrese de hacer una copia de seguridad de los datos del volumen raíz de la instancia en Amazon S3 o Amazon FSx para Lustre.
-
Todos los nodos del clúster experimentan tiempos de inactividad (los nodos aparecen como
<NotReady>en el resultado dekubectl get node) mientras se realiza la aplicación de parches. Le recomendamos que finalice todas las cargas de trabajo antes de aplicar los parches y que las reanude una vez finalizado el proceso.Si se produce un error en el parche de seguridad, puede recuperar los mensajes de error ejecutando la API
DescribeCluster, tal y como se indica en las instrucciones de Describir un clúster.
aws sagemaker update-cluster-software --cluster-nameyour-hyperpod-cluster
Al llamar a la API UpdateClusterSoftware, SageMaker HyperPod actualizará la versión de Kubernetes de los nodos. Para ello, seleccionará la DLAMI de SageMaker HyperPod más reciente en función de la versión de Kubernetes del clúster de Amazon EKS. A continuación, ejecuta los scripts del ciclo de vida en el bucket de Amazon S3 que ha especificado durante la creación o actualización del clúster.
Para verificar la versión de kubelet de un nodo, ejecute el comando kubectl describe
node.
La versión de Kubernetes de los nodos del clúster de SageMaker HyperPod no se actualiza automáticamente al actualizar la versión del clúster de Amazon EKS. Tras actualizar la versión de Kubernetes del clúster de Amazon EKS, debe utilizar la API UpdateClusterSoftware para actualizar los nodos del clúster de SageMaker HyperPod a la misma versión de Kubernetes.
Se recomienda actualizar el clúster de SageMaker HyperPod después de actualizar los nodos de Amazon EKS y evitar que haya más de una diferencia de versión entre la versión del clúster de Amazon EKS y la versión de los nodos del clúster de SageMaker HyperPod.
El equipo de servicio de SageMaker HyperPod implementa periódicamente nuevas DLAMI de SageMaker HyperPod para mejorar la seguridad, así como la experiencia de los usuarios. Le recomendamos que siga actualizando a la DLAMI más reciente de SageMaker HyperPod. Para futuras actualizaciones de la DLAMI de SageMaker HyperPod para parches de seguridad, consulte las Notas de la versión de Amazon SageMaker HyperPod.
nota
Solo puede ejecutar esta API mediante programación. La funcionalidad de aplicación de parches no está implementada en la interfaz de usuario de la consola de SageMaker HyperPod.