Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Notes de SageMaker HyperPod publication d'Amazon
Cette rubrique couvre les notes de publication qui suivent les mises à jour, les correctifs et les nouvelles fonctionnalités d'Amazon SageMaker HyperPod. Si vous recherchez des versions de fonctionnalités générales, des mises à jour et des améliorations pour Amazon SageMaker HyperPod, cette page peut vous être utile.
Les versions de l' HyperPod AMI sont documentées séparément pour inclure des informations sur les composants clés, notamment les versions générales de l'AMI, les versions et les dépendances. Si vous recherchez ces informations relatives aux versions de l' HyperPod AMI, consultezAmazon SageMaker HyperPod AMI.
SageMaker HyperPod notes de publication : 07 novembre 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités
-
Correctifs de sécurité mis à jourSageMaker HyperPod Publications d'AMI pour Amazon EKS : 7 novembre 2025.
SageMaker HyperPod notes de publication : 29 septembre 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités
-
Sortie de la nouvelle SageMaker HyperPod AMI pour Amazon EKS 1.33. Pour plus d’informations, consultez SageMaker HyperPod Publications d'AMI pour Amazon EKS : 29 septembre 2025.
Important
L'API Kubernetes bêta d'allocation dynamique des ressources est activée par défaut dans cette version.
-
Cette API améliore la planification et la surveillance des charges de travail qui nécessitent des ressources telles que GPUs.
-
Cette API a été développée par la communauté open source Kubernetes et pourrait changer dans les futures versions de Kubernetes. Avant d'utiliser l'API, consultez la documentation de Kubernetes
et comprenez comment elle affecte vos charges de travail.
-
-
HyperPod ne publie pas d'AMI HyperPod Amazon Linux 2 pour Kubernetes 1.33. AWSvous recommande de migrer vers AL2 023. Pour plus d'informations, consultez la section Mise à niveau d'Amazon Linux 2 vers AL2 023.
Pour plus d'informations, consultez Kubernetes
SageMaker HyperPod notes de publication : 4 août 2025
SageMaker HyperPod lance un nouveau public AMIs pour l'orchestration d'EKS. Le public AMIs peut être utilisé seul, ou il peut être utilisé pour créer des éléments personnalisés AMIs. Pour plus d'informations sur le public AMIs, voirPublications d’AMI publiques. Pour plus d’informations sur la création d’une AMI personnalisée, consultez Amazon Machine Images personnalisées (AMIs) pour les SageMaker HyperPod clusters.
SageMaker HyperPod notes de publication : 31 juillet 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités et améliorations
-
Publication d’une nouvelle AMI qui met à jour le système d’exploitation d’Amazon Linux 2 vers Amazon Linux 2023 pour les clusters EKS. Les principales mises à niveau incluent Linux Kernel 6.1, Python 3.10, le pilote NVIDIA 560.35.03 et le gestionnaire de packages DNF qui remplace YUM.
Important
La mise à jour d'Amazon Linux 2 vers AL2 023 introduit des modifications importantes susceptibles d'affecter la compatibilité avec les logiciels et les configurations conçus pour AL2. Nous vous recommandons vivement de tester vos applications avec AL2 023 avant de procéder à la mise à niveau complète de vos clusters.
Pour plus d’informations sur la nouvelle AMI et sur la façon de mettre à niveau vos clusters, consultez SageMaker HyperPod Publications d'AMI pour Amazon EKS : 31 juillet 2025.
SageMaker HyperPod notes de publication : 13 mai 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités et améliorations
-
Publication d’une AMI mise à jour qui prend en charge Ubuntu 22.04 LTS pour les clusters Slurm. Cette version inclut plusieurs mises à niveau du système et des composants logiciels afin d’améliorer les performances, de mettre à jour les fonctionnalités et de renforcer la sécurité.
Important
La mise à jour d’Ubuntu 20.04 LTS vers Ubuntu 22.04 LTS introduit des modifications susceptibles d’affecter la compatibilité avec les logiciels et les configurations conçus pour Ubuntu 20.04.
Pour en savoir plus, consultez :
SageMaker HyperPod notes de publication : 1er mai 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités
-
Ajout de rapports d’utilisation pour les clusters orchestrés par EKS, permettant aux entreprises de mettre en œuvre une répartition des coûts transparente et basée sur l’utilisation entre les équipes, les projets et les départements. Cette fonctionnalité complète HyperPod la fonctionnalité de gouvernance des tâches pour garantir une répartition équitable des coûts dans les AI/ML environnements mutualisés partagés. Pour plus d'informations, voir Signaler l'utilisation du calcul dans HyperPod.
SageMaker HyperPod notes de publication : 28 avril 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Slurm etOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités et améliorations
-
Mise à niveau du pilote NVIDIA de la version 550.144.03 à la version 550.163.01. Cette mise à niveau vise à remédier aux vulnérabilités et expositions courantes (CVEs) présentes dans le bulletin de sécurité de l'affichage des GPU NVIDIA d'avril 2025
.
Pour en savoir plus sur les versions d’AMI associées, consultez SageMaker HyperPod Sortie de l'AMI pour Slurm : 28 avril 2025 et SageMaker HyperPod Publications d'AMI pour Amazon EKS : 28 avril 2025.
SageMaker HyperPod notes de publication : 18 avril 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités
-
Publication d'une nouvelle SageMaker HyperPod AMI pour Amazon EKS 1.32.1. Pour de plus amples informations, veuillez consulter SageMaker HyperPod Publications d'AMI pour Amazon EKS : 18 avril 2025.
SageMaker HyperPod notes de publication : 10 avril 2025
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités et améliorations
-
Ajout d'un didacticiel de recette d'optimisation directe des préférences (DPO) pour l'orchestration SageMaker HyperPod de Slurm. Ce didacticiel de mise au point fournit des step-by-step conseils pour optimiser l'alignement des modèles à l'aide de la méthode DPO sur les clusters Slurm alimentés par un GPU SageMaker HyperPod . Pour de plus amples informations, veuillez consulter HyperPod Tutoriel DPO sur le cluster Slurm (GPU).
SageMaker HyperPod notes de publication : 03 avril 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Slurm etOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités et améliorations
-
Ajout d'une page de démarrage rapide pour le déploiement de SageMaker HyperPod clusters. La page tire parti des flux de travail de configuration rationalisés issus des SageMaker HyperPod ateliers spécialisés et automatise le déploiement à l'aide de modèles AWS CloudFormation prédéfinis. Elle prend en charge les préférences en matière d’infrastructure telles que Slurm ou Amazon EKS, pour faciliter la configuration et le déploiement des clusters de base.
-
SageMaker HyperPod prend désormais en charge les types d'instances suivants pour les clusters Slurm et Amazon EKS.
-
Nouveaux types d’instances : instances I3en, M7i, R7i. Pour obtenir la liste complète des instances prises en charge, consultez le champ
InstanceTypedansClusterInstanceGroupDetails.
-
SageMaker HyperPod notes de publication : 16 mars 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Slurm etOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités et améliorations
-
Ajout des clés de condition IAM suivantes pour un contrôle d’accès plus précis dans les opérations d’API
CreateClusteretUpdateCluster.Clé de condition Description sagemaker:InstanceTypesContrôlez l’accès en fonction des types d’instances spécifiés. sagemaker:VpcSubnetsLimitez la création ou les mises à jour de clusters à des sous-réseaux Amazon VPC spécifiques. sagemaker:VpcSecurityGroupIdsGérez l'accès en fonction du groupe de sécurité Amazon VPC. IDs
SageMaker HyperPod notes de publication : 20 février 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Slurm etOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités et améliorations
-
Ajout de la prise en charge de la suppression de groupes d'instances de votre SageMaker HyperPod cluster. Pour plus d’informations, consultez Suppression de groupes d’instances depuis les clusters orchestrés par EKS et Réduction verticale d’un cluster pour les clusters orchestrés par Slurm.
SageMaker HyperPod notes de publication : 18 février 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Slurm etOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités
-
Cette version de SageMaker HyperPod intègre une mise à jour de sécurité du kit d'outils pour conteneurs Nvidia (de la version 1.17.3 à la version 1.17.4). Pour plus d’informations, consultez Notes de mise à jour de la version 1.17.4
. Note
Pour toutes les charges de travail de conteneur de la version 1.17.4 du kit d’outils pour conteneurs Nvidia, le montage des bibliothèques de compatibilité CUDA est désormais désactivé. Pour garantir la compatibilité avec plusieurs versions de CUDA sur les flux de travail de conteneurs, mettez à jour votre
LD_LIBRARY_PATHpour inclure vos bibliothèques de compatibilité CUDA. Vous trouverez les étapes spécifiques dans Si vous utilisez une couche de compatibilité CUDA.
Pour en savoir plus sur les versions d’AMI associées, consultez SageMaker HyperPod Sortie de l'AMI pour Slurm : 18 février 2025 et SageMaker HyperPod Publications d'AMI pour Amazon EKS : 18 février 2025.
SageMaker HyperPod notes de publication : 06 février 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Slurm etOrchestration de SageMaker HyperPod clusters avec Amazon EKS.
Nouvelles fonctionnalités et améliorations
-
Support SageMaker HyperPod multi-AZ amélioré : vous pouvez spécifier différents sous-réseaux et groupes de sécurité, répartis sur différentes zones de disponibilité, pour des groupes d'instances individuels au sein de votre cluster. Pour plus d'informations sur le support SageMaker HyperPod multi-AZ, consultezConfiguration de SageMaker HyperPod clusters sur plusieurs AZs.
SageMaker HyperPod notes de publication : 22 janvier 2025
Publications d’AMI
SageMaker HyperPod notes de publication : 09 janvier 2025
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités et améliorations
-
IPv6 Support supplémentaire : les clusters peuvent utiliser l' IPv6 adressage lorsqu'ils sont configurés avec un VPC et des sous-réseaux IPv6 compatibles. Pour de plus amples informations, veuillez consulter Configuration SageMaker HyperPod avec un Amazon VPC personnalisé.
SageMaker HyperPod notes de publication : 21 décembre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
SageMaker HyperPod prend désormais en charge les types d'instances suivants pour les clusters Slurm et Amazon EKS.
-
Nouveaux types d’instances : C6gn, C6i, M6i, R6i.
-
Nouveaux types d’instances Trainium : Trn1 et Trn1n.
-
Améliorations
-
Visibilité améliorée de la journalisation des erreurs lorsque Slurm interrompt des tâches, et prévention de l’interruption inutile des étapes de tâche lors des annulations de tâches initiées par Slurm.
-
Mise à jour de la DLAMI de base pour p5en pour les clusters Slurm et Amazon EKS.
Publications d’AMI
SageMaker HyperPod notes de publication : 13 décembre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelle fonction
-
SageMaker HyperPod publie un ensemble de CloudWatch métriques Amazon pour surveiller l'état et les performances des clusters SageMaker HyperPod Slurm. Ces métriques sont liées aux informations de CPU, de GPU, d’utilisation de la mémoire et d’instances de cluster, telles que le nombre de nœuds et les nœuds défaillants. Cette fonctionnalité de surveillance est activée par défaut et les métriques sont accessibles dans l'espace de
/aws/sagemaker/ClustersCloudWatch noms. Vous pouvez également configurer des CloudWatch alarmes en fonction de ces métriques afin de détecter et de résoudre de manière proactive les problèmes potentiels au sein de leurs clusters basés sur Slurm HyperPod . Pour de plus amples informations, veuillez consulter Statistiques d'Amazon SageMaker HyperPod Slurm.
Publications d’AMI
SageMaker HyperPod notes de publication : 24 novembre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
Ajout de la prise en charge de la configuration de SageMaker HyperPod clusters dans plusieurs zones de disponibilité. Pour plus d'informations sur le support SageMaker HyperPod multi-AZ, consultezConfiguration de SageMaker HyperPod clusters sur plusieurs AZs.
Publications d’AMI
SageMaker HyperPod notes de publication : 15 novembre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm. Pour plus d’informations, consultez SageMaker HyperPod Publications d'AMI pour Amazon EKS : 15 novembre 2024.
Nouvelles fonctionnalités et améliorations
-
Ajout de la prise en charge des types d’instances trn1 et trn1n pour les clusters orchestrés Amazon EKS et Slurm.
-
Amélioration de la gestion des journaux pour les clusters Slurm :
-
Mise en œuvre de la rotation des journaux : hebdomadaire ou quotidienne en fonction de la taille.
-
Définissez la conservation des journaux sur 3 semaines.
-
Journaux compressés pour réduire l’impact sur le stockage.
-
Chargement continu des journaux vers des CloudWatch fins de conservation à long terme.
Note
Certains journaux sont toujours stockés dans syslogs.
-
-
Réglage des paramètres Fluent Bit pour éviter les problèmes de suivi avec les fichiers contenant de longues lignes.
Corrections de bugs
-
La troncature involontaire a été évitée avec les mises à jour des nœuds de contrôleur Slurm dans le fichier de configuration
slurm.config.
Publications d’AMI
SageMaker HyperPod notes de publication : 11 novembre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelle fonction
-
SageMaker HyperPod L'AMI prend désormais en charge les types d'instances G6e.
Publications d’AMI
SageMaker HyperPod notes de publication : 31 octobre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
Ajout de la réduction SageMaker HyperPod des clusters au niveau du groupe d'instances et au niveau de l'instance pour les clusters orchestrés Amazon EKS et Slurm. Pour plus d’informations sur la réduction verticale des clusters Amazon EKS, consultez Diminution d'un SageMaker HyperPod cluster. Pour plus d’informations sur la réduction verticale des clusters Slurm, consultez Réduction verticale d’un cluster dans Gestion des clusters SageMaker HyperPod Slurm à l'aide du AWS CLI.
-
SageMaker HyperPod prend désormais en charge le type d'instance P5e pour les clusters orchestrés Amazon EKS et Slurm.
SageMaker HyperPod notes de publication : 21 octobre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelle fonction
-
SageMaker HyperPod prend désormais en charge les types d'instances P5e [n], G6, Gr6 et Trn2 [n] pour les clusters Slurm et Amazon EKS.
Publications d’AMI
SageMaker HyperPod notes de publication : 10 septembre 2024
SageMaker HyperPod publie ce qui suit pour Orchestration de SageMaker HyperPod clusters avec Amazon EKS etOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
La prise en charge d'Amazon EKS a été ajoutée dans SageMaker HyperPod. Pour en savoir plus, veuillez consulter la section Orchestration de SageMaker HyperPod clusters avec Amazon EKS.
-
Ajout du support pour la gestion des SageMaker HyperPod clusters via CloudFormation Terraform. Pour plus d'informations sur la gestion des HyperPod clusters viaCloudFormation, consultez CloudFormation la documentation de
AWS::SageMaker::Cluster. Pour en savoir plus sur la gestion des HyperPod clusters via Terraform, consultez la documentation Terraformpour. awscc_sagemaker_cluster
Publications d’AMI
SageMaker HyperPod notes de publication : 20 août 2024
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
La fonctionnalité de SageMaker HyperPod reprise automatique a été améliorée, en étendant la capacité de résilience des nœuds Slurm connectés à Generic RESources (GRES).
Lorsque des ressources génériques (GRES)
sont attachées à un nœud Slurm, Slurm n’autorise généralement pas les modifications de l’allocation des nœuds, telles que le remplacement de nœuds, et n’autorise donc pas la reprise d’une tâche ayant échoué. Sauf interdiction explicite, la fonctionnalité de HyperPod reprise automatique met automatiquement en file d'attente toute tâche défectueuse associée aux nœuds compatibles GRES. Ce processus implique d’arrêter la tâche, de la replacer dans la file d’attente des tâches, puis de la redémarrer au début.
Autres modifications
-
Préemballé
slurmrestddans l' SageMaker HyperPod AMI. -
Modification des valeurs par défaut pour
ResumeTimeoutetUnkillableStepTimeoutde 60 secondes à 300 secondes dansslurm.confafin d’améliorer la réactivité du système et la gestion des tâches. -
Améliorations mineures apportées aux surveillances de l’état pour NVIDIA Data Center GPU Manager (DCGM) et l’interface de gestion du système NVIDIA (nvidia-smi).
Corrections de bugs
-
Le plug-in de HyperPod reprise automatique peut utiliser des nœuds inactifs pour reprendre une tâche.
SageMaker HyperPod notes de publication : 20 juin 2024
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
Ajout d'une nouvelle fonctionnalité permettant d'associer du stockage supplémentaire aux instances de SageMaker HyperPod cluster. Grâce à cette fonctionnalité, vous pouvez configurer un stockage supplémentaire au niveau de la configuration du groupe d'instances lors des processus de création ou de mise à jour du cluster, via la SageMaker HyperPod console ou le
CreateClusteretUpdateClusterAPIs. Le volume EBS supplémentaire est attaché à chaque instance d'un SageMaker HyperPod cluster et monté dessus./opt/sagemakerPour en savoir plus sur son implémentation dans votre SageMaker HyperPod cluster, consultez la documentation mise à jour sur les pages suivantes.Notez que vous devez mettre à jour le logiciel du HyperPod cluster pour utiliser cette fonctionnalité. Après avoir appliqué le correctif au logiciel de HyperPod cluster, vous pouvez utiliser cette fonctionnalité pour les SageMaker HyperPod clusters existants créés avant le 20 juin 2024 en ajoutant de nouveaux groupes d'instances. Cette fonctionnalité est pleinement efficace pour tous les SageMaker HyperPod clusters créés après le 20 juin 2024.
Étapes de mise à niveau
-
Exécutez la commande suivante pour appeler l'UpdateClusterSoftwareAPI afin de mettre à jour vos HyperPod clusters existants avec le DLAMI le plus récent HyperPod . Pour obtenir des instructions supplémentaires, consultez Mettre à jour le logiciel de SageMaker HyperPod plate-forme d'un cluster.
Important
Sauvegardez votre travail avant d’exécuter cette API. Le processus d’application de correctifs remplace le volume racine par l’AMI mise à jour, ce qui signifie que les données précédemment stockées dans le volume racine de l’instance seront perdues. Assurez-vous de sauvegarder vos données depuis le volume racine de l'instance vers Amazon S3 ou Amazon FSx for Lustre. Pour de plus amples informations, veuillez consulter Utilisez le script de sauvegarde fourni par SageMaker HyperPod.
aws sagemaker update-cluster-software --cluster-nameyour-cluster-nameNote
Notez que vous devez exécuter la AWS CLI commande pour mettre à jour votre HyperPod cluster. La mise à jour du HyperPod logiciel via l'interface utilisateur de SageMaker HyperPod la console n'est actuellement pas disponible.
SageMaker HyperPod notes de publication : 24 avril 2024
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Corrections de bugs
-
Correction d’un bogue avec le paramètre
ThreadsPerCoredans l’APIClusterInstanceGroupSpecification. Avec le correctif, et prennentCreateClusteret appliquentUpdateClusterAPIs correctement les entrées de l'utilisateurThreadsPerCore. Ce correctif est effectif sur les HyperPod clusters créés après le 24 avril 2024. Si vous avez rencontré des problèmes avec ce bogue et que vous souhaitez appliquer ce correctif à votre cluster, vous devez créer un nouveau cluster. Assurez-vous de sauvegarder et de restaurer votre travail lorsque vous passez à un nouveau cluster en suivant les instructions fournies dans Utilisez le script de sauvegarde fourni par SageMaker HyperPod.
SageMaker HyperPod notes de publication : 27 mars 2024
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
HyperPod correctif logiciel
L'équipe HyperPod de service distribue des correctifs logiciels par le biais deSageMaker HyperPod DLAMI. Consultez les informations suivantes sur le dernier HyperPod DLAMI.
-
Dans cette version du HyperPod DLAMI, Slurm est construit avec REST service
slurmestd() avec le support JSON, YAML et JWT. -
Mise à niveau de Slurm
vers la version 23.11.3.
Améliorations
-
Augmentation du délai d’expiration du service de reprise automatique à 60 minutes.
-
Amélioration du processus de remplacement d’instance pour ne pas redémarrer le contrôleur Slurm.
-
Amélioration des messages d’erreur liés à l’exécution de scripts de cycle de vie, tels que les erreurs de téléchargement et les erreurs de surveillance de l’état de l’instance au démarrage de l’instance.
Corrections de bugs
-
Correction d’un bogue lié au service chrony qui provoquait un problème de synchronisation de l’heure.
-
Correction d’un bogue lié à l’analyse de
slurm.conf. -
Correction d’un problème avec la bibliothèque NVIDIA
go-dcgm.
SageMaker HyperPod notes de publication : 14 mars 2024
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Améliorations
-
HyperPod prend désormais correctement en charge la transmission des noms de partition fournis
provisioning_parameters.jsonet crée des partitions de manière appropriée en fonction des entrées fournies. Pour plus d’informations surprovisioning_parameters.json, consultez SageMaker HyperPod formulaires et Personnalisation des SageMaker HyperPod clusters à l'aide de scripts de cycle de vie.
Publications d’AMI
SageMaker HyperPod notes de publication : 15 février 2024
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
Ajout d'une nouvelle
UpdateClusterSoftwareAPI pour les correctifs SageMaker HyperPod de sécurité. Lorsque des correctifs de sécurité seront disponibles, nous vous recommandons de mettre à jour les SageMaker HyperPod clusters existants de votre compte en exécutantaws sagemaker update-cluster-software --cluster-name. Pour effectuer le suivi des futurs correctifs de sécurité, suivez cette page des notes SageMaker HyperPod de publication d'Amazon. Pour découvrir comment l’APIyour-cluster-nameUpdateClusterSoftwarefonctionne, consultez Mettre à jour le logiciel de SageMaker HyperPod plate-forme d'un cluster.
SageMaker HyperPod notes de publication : 29 novembre 2023
SageMaker HyperPod publie ce qui suit pourOrchestration de SageMaker HyperPod clusters avec Slurm.
Nouvelles fonctionnalités
-
J'ai lancé Amazon SageMaker HyperPod à AWS re:Invent 2023.
Publications d’AMI