Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Automatische Skalierung von Amazon SageMaker AI-Modellen
Amazon SageMaker AI unterstützt die automatische Skalierung (Auto Scaling) für Ihre gehosteten Modelle. Auto Scaling passt dynamisch die Anzahl der Instances an, die für ein Modell als Reaktion auf Workload-Änderungen zur Verfügung gestellt werden. Wenn die Arbeitslast steigt, bringt die automatische Skalierung mehr Instances online. Wenn die Arbeitslast sinkt, werden durch die automatische Skalierung unnötige Instances entfernt, so dass Sie nicht für bereitgestellte Instances zahlen, die Sie nicht nutzen.
Themen
Überprüfen des Status einer Skalierungsaktivität durch Beschreibung der Skalierungsaktivitäten
Wird verwendetCloudFormation, um eine Skalierungsrichtlinie zu erstellen
Aktualisieren von Endpunkten, für die das Auto Scaling verwendet wird
Löschen von Endpunkten, die für das Auto Scaling konfiguriert wurden