Amazon SageMaker HyperPod AMI
Amazon SageMaker HyperPod Amazon Machine Images (AMIs) sind spezialisierte Maschinenimages für verteilte Workloads für maschinelles Lernen und Hochleistungsrechnen. Diese AMIs erweitern Basisimages um wichtige Komponenten wie GPU-Treiber und AWS Neuron-Beschleuniger-Unterstützung.
Zu den wichtigsten Komponenten, die den HyperPod-AMIs hinzugefügt wurden, gehören:
-
Öffentliche AMIs mit Unterstützung für die Erstellung benutzerdefinierter AMIs
-
Fortgeschrittene Orchestrierungstools:
-
Abhängigkeiten der Clusterverwaltung
-
Integrierte Zuverlässigkeitsfeatures:
-
Cluster-Zustandsprüfung
-
Funktionen zur automatischen Wiederaufnahme
-
-
Support für die Verwaltung und Konfiguration von HyperPod-Clustern
Diese Verbesserungen basieren auf den folgenden grundlegenden Deep Learning AMIs (DLAMIs):
-
AWSDeep Learning Base GPU AMI (Ubuntu 20.04)
für Orchestrierung mit Slurm. -
Amazon Linux 2 oder Amazon Linux 2023 basierendes AMI für die Orchestrierung mit Amazon EKS.
Wählen Sie Ihre HyperPod-AMIs auf der Grundlage Ihrer Orchestrierungspräferenz aus:
-
Informationen zur Slurm-Orchestrierung finden Sie unter AMI-Veröffentlichungen von SageMaker HyperPod für Slurm.
-
Informationen zur Amazon EKS-Orchestrierung finden Sie unterAMI-Veröffentlichungen von SageMaker HyperPod für Amazon EKS.
Weitere Informationen zu Feature-Veröffentlichungen von Amazon SageMaker HyperPod finden Sie unter Versionshinweise zu Amazon SageMaker HyperPod.