Amazon SageMaker Profiler
|
Amazon SageMaker Profiler ist derzeit als Vorschauversion kostenlos in unterstützten AWS-Regionen erhältlich. Die allgemein verfügbare Version von Amazon SageMaker Profiler enthält ggf. Funktionen und Preise, die sich von den in der Vorschauversion angebotenen unterscheiden. |
Amazon SageMaker Profiler ist eine Funktion von Amazon SageMaker AI, die einen detaillierten Überblick über die AWS Datenverarbeitungsressourcen bietet, die bei dem Training von Deep-Learning-Modellen auf SageMaker AI bereitgestellt werden. Der Schwerpunkt liegt auf der Erstellung von Profilen der CPU- und GPU-Auslastung, Kernelausführungen auf GPUs, Kernelstarts auf CPUs, Synchronisierungsoperationen, Speicheroperationen zwischen CPUs und GPUs, Latenzen zwischen Kernelstarts und entsprechenden Durchläufen sowie der Datenübertragung zwischen CPUs und GPUs. SageMaker Profiler bietet auch eine Benutzeroberfläche (UI), die das Profil visualisiert, eine statistische Zusammenfassung der profilierten Ereignisse und den Zeitrahmen eines Trainingsauftrags zur Verfolgung und zum Verständnis der zeitlichen Beziehung der Ereignisse zwischen GPUs und CPUs.
Anmerkung
SageMaker Profiler unterstützt PyTorch und TensorFlow und ist in AWSDeep-Learning-Containern für SageMaker AI
Für Datenwissenschaftler
Bei dem Training von Deep-Learning-Modellen auf einem großen Datenverarbeitungscluster treten häufig Probleme bei der rechnerischen Optimierung auf, z. B. kommt es zu Engpässen, Latenzen beim Kernelstart, Speicherlimits und geringer Ressourcenauslastung.
Um solche Probleme bei der Datenverarbeitungsleistung zu identifizieren, müssen Sie die Datenverarbeitungsressourcen genauer untersuchen, um zu verstehen, welche Kernel Latenzen und welche Operationen Engpässe verursachen. Datenwissenschaftler können die Vorteile nutzen, die die Benutzeroberfläche von SageMaker Profiler bei der Visualisierung des detaillierten Profils von Trainingsauftrags bietet. Die Benutzeroberfläche bietet ein Dashboard mit Übersichtsdiagrammen und einer Oberfläche mit einer Zeitrahmen, über die jedes Ereignis auf den Datenverarbeitungsressourcen verfolgt werden kann. Datenwissenschaftler können mithilfe der Python-Module von SageMaker Profiler auch benutzerdefinierte Anmerkungen hinzufügen, um bestimmte Teile des Trainingsauftrags nachzuverfolgen.
Für Administratoren
Über die Profiler-Zielseite in der SageMaker-AI-Konsole oder in der SageMaker-AI-Domain können Sie die Benutzer der Profiler-Anwendung verwalten, wenn Sie Administrator eines AWS Kontos oder einer SageMaker-AI-Domain sind. Jeder Domain-Benutzer mit den erteilten Berechtigungen kann auf seine eigene Profiler-Anwendung zugreifen. Als Administrator und Benutzer der SageMaker-AI-Domain können Sie die Profiler-Anwendung mit der entsprechenden Berechtigungsstufe erstellen und löschen.