

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Real-time Folgerung
<a name="realtime-endpoints"></a>

 Real-time Inferenz ist ideal für Inferenz-Workloads, bei denen interaktive Echtzeitanforderungen mit geringer Latenz erfüllt werden müssen. Sie können Ihr Modell für SageMaker KI-Hosting-Dienste bereitstellen und erhalten einen Endpunkt, der für Inferenzen verwendet werden kann. Diese Endgeräte werden vollständig verwaltet und unterstützen Autoscaling (siehe [Automatische Skalierung von Amazon SageMaker AI-Modellen](endpoint-auto-scaling.md)). Sie können einzelne Instances und Container auf Ihren Endpunkten mit erweiterten Metriken überwachen (siehe[Verbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte](monitoring-cloudwatch-enhanced-metrics.md)).

**Topics**
+ [Modelle für Echtzeit-Inferenzen bereitstellen](realtime-endpoints-deploy-models.md)
+ [Aufrufen von Modellen für Echtzeit-Inferenz](realtime-endpoints-test-endpoints.md)
+ [Endpunkte mit APIs aufrufen OpenAI-compatible](realtime-endpoints-openai-compatible.md)
+ [Endpunkte](realtime-endpoints-manage.md)
+ [Hosting-Optionen](realtime-endpoints-options.md)
+ [Automatische Skalierung von Amazon SageMaker AI-Modellen](endpoint-auto-scaling.md)
+ [Instance-Speicher-Volumes](host-instance-storage.md)
+ [Validieren von Modellen in der Produktion](model-validation.md)
+ [Online-Erklärbarkeit mit Clarify SageMaker](clarify-online-explainability.md)
+ [Bereitstellung auf mehreren Instanztypen mit Instanzpools](realtime-endpoints-heterogeneous.md)
+ [Fine-tune Modelle mit Adapter-Inferenzkomponenten](realtime-endpoints-adapt.md)