Mise à jour du logiciel SageMaker HyperPod de la plateforme - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mise à jour du logiciel SageMaker HyperPod de la plateforme

Lorsque vous créez votre SageMaker HyperPod cluster, sélectionnez SageMaker HyperPod une Amazon Machine Image (AMI) correspondant à la version Kubernetes de votre cluster Amazon EKS.

Exécutez update-cluster-softwarepour mettre à jour les clusters existants à l'aide des logiciels et des correctifs de sécurité fournis par le SageMaker HyperPod service. Pour --cluster-name, spécifiez le nom ou l’ARN du cluster à mettre à jour.

Important
  • Lorsque cette API est appelée, SageMaker HyperPod elle ne vide ni ne redistribue les tâches (Pods) exécutées sur les nœuds. Assurez-vous de vérifier si des tâches sont en cours d’exécution sur les nœuds avant d’appeler cette API.

  • Le processus d’application de correctifs remplace le volume racine par l’AMI mise à jour, ce qui signifie que les données précédemment stockées dans le volume racine de l’instance seront perdues. Assurez-vous de sauvegarder vos données depuis le volume racine de l'instance vers Amazon S3 ou Amazon FSx for Lustre.

  • Tous les nœuds du cluster subissent une durée d’indisponibilité (les nœuds apparaissent comme <NotReady> dans la sortie de kubectl get node) alors que l’application des correctifs est en cours. Nous vous recommandons de résilier toutes les charges de travail avant d’appliquer le correctif et de les reprendre une fois l’application du correctif terminée.

    Si l’application du correctif de sécurité échoue, vous pouvez extraire les messages d’échec en exécutant l’API DescribeCluster comme indiqué dans Description d’un cluster.

aws sagemaker update-cluster-software --cluster-name your-hyperpod-cluster

Lorsque vous appelez l'UpdateClusterSoftwareAPI, mettez SageMaker HyperPod à jour la version Kubernetes des nœuds en sélectionnant la dernière version en SageMaker HyperPod DLAMI fonction de la version Kubernetes de votre cluster Amazon EKS. Il exécute ensuite les scripts de cycle de vie dans le compartiment Amazon S3 que vous avez spécifié lors de la création ou de la mise à jour du cluster.

Vous pouvez vérifier la version de kubelet d’un nœud en exécutant la commande kubectl describe node.

La version Kubernetes des nœuds de SageMaker HyperPod cluster n'est pas automatiquement mise à jour lorsque vous mettez à jour la version de votre cluster Amazon EKS. Après avoir mis à jour la version de Kubernetes pour votre cluster Amazon EKS, vous devez utiliser l'UpdateClusterSoftwareAPI pour mettre à jour les nœuds de votre SageMaker HyperPod cluster vers la même version de Kubernetes.

Il est recommandé de mettre à jour votre SageMaker HyperPod cluster après avoir mis à jour vos nœuds Amazon EKS, et d'éviter qu'il y ait plus d'une différence de version entre la version du cluster Amazon EKS et la version des nœuds du SageMaker HyperPod cluster.

L'équipe SageMaker HyperPod de service déploie régulièrement de nouvelles SageMaker HyperPod DLAMI solutions pour renforcer la sécurité et améliorer l'expérience utilisateur. Nous vous recommandons de toujours mettre à jour le DLAMI le plus récent SageMaker HyperPod . Pour les futures SageMaker HyperPod mises à jour du DLAMI relatives aux correctifs de sécurité, contactez. Notes de SageMaker HyperPod publication d'Amazon

Note

Vous pouvez exécuter cette API uniquement par programmation. La fonctionnalité d'application de correctifs n'est pas implémentée dans l'interface utilisateur de la SageMaker HyperPod console.