SageMaker HyperPodAmazon-Beobachtbarkeit mit Amazon Managed Grafana und Amazon Managed Service für Prometheus - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker HyperPodAmazon-Beobachtbarkeit mit Amazon Managed Grafana und Amazon Managed Service für Prometheus

Amazon SageMaker HyperPod (SageMaker HyperPod) bietet ein umfassendes out-of-the-box Dashboard, das Ihnen Einblicke in die Entwicklungsaufgaben und Clusterressourcen von Foundation Model (FM) bietet. Diese vereinheitlichte Observability-Lösung veröffentlicht automatisch wichtige Metriken in Amazon Managed Service für Prometheus und zeigt sie in Amazon-Managed Grafana-Dashboards an. Die Dashboards wurden speziell für die FM-Entwicklung optimiert und decken umfassende Informationen zum Zustand der Hardware, zur Ressourcennutzung und zur Leistung auf Aufgabenebene ab. Mit diesem Add-on können Sie Integritäts- und Leistungsdaten von NVIDIA DCGM, Kubernetes-Node-Exportern auf Instanzebene, Elastic Fabric Adapter, integrierten Dateisystemen, Kubernetes, APIs Kueue und Task-Operatoren konsolidieren. SageMaker HyperPod