Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Mettre à jour la configuration SageMaker HyperPod du cluster
Exécutez update-cluster pour mettre à jour la configuration d’un cluster.
Note
Considérations importantes :
-
Vous ne pouvez pas modifier les informations du cluster EKS auxquelles votre HyperPod cluster est associé une fois celui-ci créé.
-
Si des vérifications de surveillance approfondie de l’état sont exécutées sur le cluster, cette API ne fonctionnera pas comme prévu. Vous pouvez rencontrer un message d’erreur indiquant que des vérifications de surveillance approfondie de l’état sont en cours. Pour mettre à jour le cluster, vous devez attendre que les vérifications de surveillance approfondie de l’état soient terminées.
-
Créez un fichier de demande d’API
UpdateClusterau format JSON. Assurez-vous de spécifier le nom du cluster et le nom du groupe d’instances appropriés à mettre à jour. Pour chaque groupe d’instances, vous pouvez modifier le type d’instance, le nombre d’instances, le script de point d’entrée de configuration de cycle de vie et le chemin vers ce script.Note
Vous pouvez utiliser le
UpdateClusterpour réduire ou supprimer des groupes d'instances entiers de votre SageMaker HyperPod cluster. Pour obtenir des instructions supplémentaires sur la manière de réduire verticalement ou de supprimer les groupes d’instances, consultez Diminution d'un SageMaker HyperPod cluster.-
Pour
ClusterName, spécifiez le nom du cluster que vous voulez mettre à jour. -
Pour
InstanceGroupName-
Pour mettre à jour un groupe d’instances existant, spécifiez le nom du groupe d’instances que vous souhaitez mettre à jour.
-
Pour ajouter un nouveau groupe d’instances, spécifiez un nouveau nom qui n’existe pas dans votre cluster.
-
-
Pour
InstanceType-
Pour mettre à jour un groupe d’instances existant, vous devez mettre en correspondance le type d’instance que vous avez initialement spécifié avec ce groupe.
-
Pour ajouter un nouveau groupe d’instances, spécifiez un type d’instance avec lequel vous souhaitez configurer le groupe.
-
-
Pour
InstanceCount-
Pour mettre à jour un groupe d’instances existant, spécifiez un entier correspondant au nombre d’instances que vous souhaitez. Vous pouvez fournir une valeur supérieure ou inférieure (jusqu’à 0) pour augmenter ou réduire verticalement le groupe d’instances.
-
Pour ajouter un nouveau groupe d’instances, spécifiez un entier supérieur ou égal à 1.
-
-
Pour
LifeCycleConfig, vous pouvez modifier à la fois les valeursSourceS3UrietOnCreatecomme vous le souhaitez pour mettre à jour le groupe d’instances. -
Pour
ExecutionRole-
Pour mettre à jour un groupe d’instances existant, continuez à utiliser le même rôle IAM que celui que vous avez attaché lors de la création du cluster.
-
Pour ajouter un nouveau groupe d’instances, spécifiez un rôle IAM que vous souhaitez attacher.
-
-
Pour
ThreadsPerCore-
Pour mettre à jour un groupe d’instances existant, continuez à utiliser la même valeur que vous avez spécifiée lors de la création du cluster.
-
Pour ajouter un nouveau groupe d’instances, vous pouvez choisir n’importe quelle valeur parmi les options autorisées par type d’instance. Pour plus d'informations, recherchez le type d'instance et consultez la colonne Threads valides par cœur dans le tableau de référence des cœurs de processeur et des threads par cœur de processeur par type d'instance dans le guide de EC2 l'utilisateur Amazon.
-
-
Pour
OnStartDeepHealthChecks, ajoutezInstanceStressetInstanceConnectivitypour activer Vérifications de surveillance approfondie de l’état. -
Pour
NodeRecovery, spécifiezAutomaticd'activer la restauration automatique des nœuds. SageMaker HyperPod remplace ou redémarre les instances (nœuds) lorsque des problèmes sont détectés par l'agent de surveillance de l'état.
L’extrait de code suivant est un modèle de fichier de demande JSON que vous pouvez utiliser. Pour plus d'informations sur la syntaxe des demandes et les paramètres de cette API, consultez la référence de l'UpdateClusterAPI.
// update_cluster.json { // Required "ClusterName": "name-of-cluster-to-update", // Required "InstanceGroups": [{ "InstanceGroupName":"string", "InstanceType":"string", "InstanceCount":number, "LifeCycleConfig": { "SourceS3Uri":"string", "OnCreate":"string"}, "ExecutionRole":"string", "ThreadsPerCore":number, "OnStartDeepHealthChecks": ["InstanceStress", "InstanceConnectivity"] }], "NodeRecovery": "Automatic" } -
-
Exécutez la commande
update-clustersuivante pour soumettre la demande.aws sagemaker update-cluster \ --cli-input-jsonfile://complete/path/to/update_cluster.json