View a markdown version of this page

Real-time Folgerung - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Real-time Folgerung

Real-time Inferenz ist ideal für Inferenz-Workloads, bei denen interaktive Echtzeitanforderungen mit geringer Latenz erfüllt werden müssen. Sie können Ihr Modell für SageMaker KI-Hosting-Dienste bereitstellen und erhalten einen Endpunkt, der für Inferenzen verwendet werden kann. Diese Endgeräte werden vollständig verwaltet und unterstützen Autoscaling (siehe Automatische Skalierung von Amazon SageMaker AI-Modellen). Sie können einzelne Instances und Container auf Ihren Endpunkten mit erweiterten Metriken überwachen (sieheVerbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte).