Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Kapazitätsblöcke für ML
Kapazitätsblöcke für ML erlauben es Ihnen, GPU-basierte beschleunigte Computing-Instances für einen zukünftigen Zeitpunkt zu reservieren, um Ihre kurzfristigen Machine Learning (ML)-Workloads zu unterstützen. Instances, die innerhalb eines Kapazitätsblocks ausgeführt werden, werden innerhalb von Amazon
Sie können Kapazitätsblöcke auch verwenden, um Kapazität für Amazon zu reservieren EC2 UltraServers. UltraServers verbinden Sie mehrere EC2 Amazon-Instances innerhalb einer Accelerator-Verbindung mit niedriger Latenz und hoher Bandbreite. Sie können UltraServers es verwenden, um die rechen- und speicherintensivsten AI/ML Workloads in den Bereichen Training, Feinabstimmung und Inferenz zu bewältigen. Weitere Informationen finden Sie auf Amazon EC2 UltraServers
Mit Kapazitätsblöcken können Sie sehen, wann GPU-Instance-Kapazität an zukünftigen Terminen verfügbar ist, und Sie können einen Kapazitätsblock so planen, dass er zu einem Zeitpunkt startet, der für Sie am besten passt. Wenn Sie einen Kapazitätsblock reservieren, erhalten Sie eine vorhersehbare Kapazitätsgarantie für GPU-Instance und zahlen nur für die Zeit, die Sie benötigen. Wir empfehlen Capacity Blocks GPUs , wenn Sie Ihre ML-Workloads tage- oder wochenlang unterstützen müssen und nicht für eine Reservierung bezahlen möchten, während Ihre GPU-Instances nicht genutzt werden.
Im Folgenden sind einige häufige Anwendungsfälle für Kapazitätsblöcke aufgeführt.
-
Modell-Training und Feinabstimmung für Machine Learning (ML) – Erhalten Sie ununterbrochenen Zugriff auf die GPU-Instances, die Sie für die Durchführung des ML-Modell-Trainings und der Feinabstimmung reserviert haben.
-
ML-Experimente und Prototypen – Führen Sie Experimente durch und erstellen Sie Prototypen, die kurzfristig GPU-Instances erfordern.
Kapazitätsblöcke sind in einigen AWS Regionen für ausgewählte Instance-Typen verfügbar. Weitere Informationen finden Sie unterUnterstützte Instance-Typen und Regionen.
Sie können einen Kapazitätsblock mit einem Reservierungsstartzeitpunkt bis zu acht Wochen in der Zukunft reservieren. Jeder Kapazitätsblock kann bis zu 64 Instances haben, und Sie können bis zu 256 Instances in mehreren Kapazitätsblöcken haben.
Themen
Unterstützte Instance-Typen und Regionen
Instance- und UltraServer Capacity-Blöcke können mit den folgenden Instance-Typen und AWS Regionen verwendet werden.
Anmerkung
Kapazitätsblockgrößen von 64 Instances werden nicht für alle Instance-Typen in allen AWS-Regionen unterstützt.
Kapazitätsblöcke für Instanzen
-
p6-b300.48xlargeUSA West (Oregon) —
us-west-2
-
p6-b200.48xlargeUSA Ost (Nord-Virginia) —
us-east-1USA Ost (Ohio) —
us-east-2USA West (Oregon) —
us-west-2
-
p5.4xlargeUSA Ost (Nord-Virginia) —
us-east-1USA Ost (Ohio) —
us-east-2USA West (Oregon) —
us-west-2Europa (London) —
eu-west-2Asien-Pazifik (Mumbai) —
ap-south-1Asien-Pazifik (Tokio) —
ap-northeast-1Asien-Pazifik (Sydney) —
ap-southeast-2Südamerika (São Paulo) —
sa-east-1
-
p5.48xlargeUSA Ost (Nord-Virginia) —
us-east-1USA Ost (Ohio) —
us-east-2USA West (Nordkalifornien) —
us-west-1USA West (Oregon) —
us-west-2Europa (Stockholm) —
eu-north-1Europa (London) —
eu-west-2Südamerika (São Paulo) —
sa-east-1Asien-Pazifik (Tokio) —
ap-northeast-1Asien-Pazifik (Mumbai) —
ap-south-1Asien-Pazifik (Sydney) —
ap-southeast-2Asien-Pazifik (Jakarta) —
ap-southeast-3
-
p5e.48xlargeUSA Ost (Nord-Virginia) —
us-east-1USA Ost (Ohio) —
us-east-2USA West (Nordkalifornien) —
us-west-1USA West (Oregon) —
us-west-2Europa (Stockholm) —
eu-north-1Europa (London) —
eu-west-2Europa (Spanien) —
eu-south-2Südamerika (São Paulo) —
sa-east-1Asien-Pazifik (Tokio) —
ap-northeast-1Asien-Pazifik (Seoul) —
ap-northeast-2Asien-Pazifik (Mumbai) —
ap-south-1Asien-Pazifik (Jakarta) —
ap-southeast-3
-
p4d.24xlargeUSA Ost (Nord-Virginia) —
us-east-1USA Ost (Ohio) —
us-east-2USA West (Oregon) —
us-west-2
-
p4de.24xlargeUSA Ost (Nord-Virginia) —
us-east-1USA West (Oregon) —
us-west-2
-
trn1.32xlargeUSA Ost (Nord-Virginia) —
us-east-1USA Ost (Ohio) —
us-east-2USA West (Nordkalifornien) —
us-west-1USA West (Oregon) —
us-west-2Europa (Stockholm) —
eu-north-1Asien-Pazifik (Mumbai) —
ap-south-1Asien-Pazifik (Sydney) —
ap-southeast-2Asien-Pazifik (Melbourne) —
ap-southeast-4
-
trn2.3xlargeAsien-Pazifik (Melbourne) —
ap-southeast-4Südamerika (São Paulo) —
sa-east-1
-
trn2.48xlargeUSA Ost (Ohio) —
us-east-2
UltraServer Kapazitätsblöcke
-
Trn2USA Ost (Ohio) —
us-east-2
-
P6e-GB200Lokale Zone von Dallas (Nord-Virginia) —
us-east-1-dfw-2a
Unterstützte Plattformen
Capacity Blocks für ML unterstützen derzeit nur Instances und UltraServers zwar nur mit Standard-Tenancy. Wenn Sie den AWS-Managementkonsole zum Kauf eines Kapazitätsblocks verwenden, ist die Standardplattformoption Linux/UNIX. Wenn Sie das AWS Command Line Interface (AWS CLI) oder AWS SDK zum Kauf eines Capacity-Blocks verwenden, sind die folgenden Plattformoptionen verfügbar:
-
Linux/Unix
-
Red Hat Enterprise Linux
-
RHEL mit HA
-
SUSE Linux
-
Ubuntu Pro
Überlegungen
Berücksichtigen Sie vor der Verwendung von Kapazitätsblöcken die folgenden Details und Einschränkungen.
-
Wenn wir eine Beeinträchtigung feststellen, die sich auf einen UltraServer Kapazitätsblock auswirkt, werden wir Sie benachrichtigen, aber im Allgemeinen werden wir keine Maßnahmen ergreifen, um Ihre Instances auf dem Kapazitätsblock zu beenden. Dies dient dazu, unbeabsichtigte Unterbrechungen Ihrer Workloads zu minimieren. Nach Erhalt dieser Benachrichtigung können Sie den UltraServer Kapazitätsblock unverändert weiter verwenden oder eine Behebung beantragen, indem Sie alle Instances auf dem Kapazitätsblock beenden und eine AWS Support-Anfrage einreichen. Nachdem wir Ihre Support-Anfrage erhalten haben, werden wir Sie benachrichtigen, sobald wir die Behebung abgeschlossen haben und Sie Instances auf Ihrem Capacity Block neu starten können. UltraServer
-
Bei
P6e-GB200UltraServer Kapazitätsblöcken müssen Sie Ihre Instances mindestens 60 Minuten vor dem Ende des Kapazitätsblocks beenden. -
Um
P6e-GB200UltraServer Capacity Blocks verwenden zu können, müssen Sie für die lokale Zone von Dallas (Nord-Virginia) angemeldet sein. -
Jeder Kapazitätsblock kann bis zu 64 Instances haben, und Sie können bis zu 256 Instances in mehreren Kapazitätsblöcken haben.
-
Sie können Kapazitätsblockangebote beschreiben, die bereits in 30 Minuten beginnen können.
-
Kapazitätsblöcke beginnen und enden um 11:30 Uhr koordinierte Weltzeit (UTC).
-
Der Beendigungsprozess für Instances, die in einem Kapazitätsblock ausgeführt werden, beginnt um 11:00 Uhr koordinierter Weltzeit (UTC) am letzten Tag der Reservierung.
-
Kapazitätsblöcke können mit einer Startzeit bis zu 8 Wochen in der Zukunft reserviert werden.
-
Stornierungen von Kapazitätsblöcken sind nicht zulässig.
-
Ein Kapazitätsblock kann nicht verschoben oder aufgeteilt werden.
-
Kapazitätsblöcke können nicht zwischen AWS Konten oder innerhalb Ihrer AWS Organisation gemeinsam genutzt werden.
-
Nur UltraServer Kapazitätsblöcke können mit Ressourcengruppen verwendet werden. Instance-Kapazitätsblöcke können nicht mit Ressourcengruppen verwendet werden. Weitere Informationen finden Sie unter Erstellen Sie eine Ressourcengruppe für UltraServer Capacity Blocks.
-
Die Gesamtzahl der Instanzen, die in Kapazitätsblöcken für alle Konten in Ihrer AWS Organisation reserviert werden können, darf an einem bestimmten Datum 256 Instanzen nicht überschreiten.
-
Um einen Kapazitätsblock zu verwenden, müssen Instances gezielt die Reservierungs-ID verwenden.
-
Instances in einem Kapazitätsblock werden nicht auf Ihre On-Demand-Instances angerechnet.
-
Stellen Sie für P5-Instances, die ein benutzerdefiniertes AMI verwenden, sicher, dass Sie über die erforderliche Software und Konfiguration für EFA verfügen.
-
Informationen zu verwalteten Amazon EKS-Knotengruppen finden Sie unter Erstellen einer verwalteten Knotengruppe mit Amazon EC2 Capacity Blocks for ML. Informationen zu selbstverwalteten Amazon-EKS-Knotengruppen finden Sie unter Verwenden von Kapazitätsblöcken für ML mit selbstverwalteten Knoten.
Zugehörige Ressourcen
Nachdem Sie einen Kapazitätsblock erstellt haben, können Sie mit dem Kapazitätsblock Folgendes tun:
-
Starten Sie Instances im Kapazitätsblock. Weitere Informationen finden Sie unter Instances mit Kapazitätsblöcken starten.
-
Erstellen Sie eine Amazon EC2 Auto Scaling Scaling-Gruppe. Weitere Informationen finden Sie unter Verwenden von Kapazitätsblöcken für Machine-Learning-Workloads im Amazon EC2 Auto Scaling Scaling-Benutzerhandbuch.
Anmerkung
Wenn Sie Amazon EC2 Auto Scaling oder Amazon EKS verwenden, können Sie die Skalierung so planen, dass sie zu Beginn der Kapazitätsblockreservierung ausgeführt wird. Bei der geplanten Skalierung werden Wiederholungsversuche AWS automatisch für Sie erledigt, sodass Sie sich keine Gedanken über die Implementierung der Wiederholungslogik für vorübergehende Ausfälle machen müssen.
-
Verbessern Sie ML-Workflows mit. AWS ParallelCluster Weitere Informationen finden Sie unter Verbesserung von ML-Workflows mit AWS ParallelCluster und Amazon EC2 Capacity Blocks for ML
.
Weitere Informationen zu AWS ParallelCluster finden Sie unter Was ist AWS ParallelCluster.