

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Automatische Skalierung von Amazon SageMaker AI-Modellen
<a name="endpoint-auto-scaling"></a>

Amazon SageMaker AI unterstützt die automatische Skalierung (Auto Scaling) für Ihre gehosteten Modelle. *Auto Scaling* passt dynamisch die Anzahl der Instances an, die für ein Modell als Reaktion auf Workload-Änderungen zur Verfügung gestellt werden. Wenn die Arbeitslast steigt, bringt die automatische Skalierung mehr Instances online. Wenn die Arbeitslast sinkt, werden durch die automatische Skalierung unnötige Instances entfernt, so dass Sie nicht für bereitgestellte Instances zahlen, die Sie nicht nutzen. Weitere Informationen zur Verwendung von Instanz-Metriken für Skalierungsentscheidungen finden Sie unter [Verbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte](monitoring-cloudwatch-enhanced-metrics.md) [Verbesserte Metriken für Amazon SageMaker AI-Endpunkte](https://aws.amazon.com/blogs/machine-learning/enhanced-metrics-for-amazon-sagemaker-ai-endpoints-deeper-visibility-for-better-performance/).

**Topics**
+ [Überblick über Auto-Scaling-Richtlinien](endpoint-auto-scaling-policy.md)
+ [Voraussetzungen für Auto Scaling](endpoint-auto-scaling-prerequisites.md)
+ [Konfigurieren Sie Auto Scaling für Modelle über die Konsole](endpoint-auto-scaling-add-console.md)
+ [Registrieren eines Modells](endpoint-auto-scaling-add-policy.md)
+ [Definieren einer Skalierungsrichtlinie](endpoint-auto-scaling-add-code-define.md)
+ [Anwenden einer Skalierungsrichtlinie](endpoint-auto-scaling-add-code-apply.md)
+ [Anweisungen zum Bearbeiten einer Skalierungsrichtlinie](endpoint-auto-scaling-edit.md)
+ [Vorübergehendes Deaktivieren von Skalierungsrichtlinien](endpoint-auto-scaling-suspend-scaling-activities.md)
+ [Löschen einer Skalierungsrichtlinie](endpoint-auto-scaling-delete.md)
+ [Überprüfen des Status einer Skalierungsaktivität durch Beschreibung der Skalierungsaktivitäten](endpoint-scaling-query-history.md)
+ [Skalieren eines Endpunkts auf null Instances](endpoint-auto-scaling-zero-instances.md)
+ [Lasttest Ihrer Auto -Scaling-Konfiguration](endpoint-scaling-loadtest.md)
+ [Verwenden Sie CloudFormation um eine Skalierungsrichtlinie zu erstellen](endpoint-scaling-cloudformation.md)
+ [Aktualisieren von Endpunkten, für die das Auto Scaling verwendet wird](endpoint-scaling-update.md)
+ [Löschen von Endpunkten, die für das Auto Scaling konfiguriert wurden](endpoint-delete-with-scaling.md)