So verarbeitet Amazon SageMaker AI die Trainingsausgabe - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So verarbeitet Amazon SageMaker AI die Trainingsausgabe

Da Ihr Algorithmus in einem Container ausgeführt wird, generiert er Ausgaben, einschließlich des Status des Trainingsauftrags und -modells und der Ausgabeartefakte. Der Algorithmus sollte diese Informationen in die folgenden Dateien schreiben, die sich im /output-Verzeichnis des Containers befinden. Amazon SageMaker AI verarbeitet die in diesem Verzeichnis enthaltenen Informationen wie folgt:

  • /opt/ml/model – Ihr Algorithmus sollte alle endgültigen Modellartefakte in dieses Verzeichnis schreiben. SageMaker AI kopiert diese Daten als einzelnes Objekt im komprimierten TAR-Format an den S3-Speicherort, den Sie in der CreateTrainingJob-Anforderung angegeben haben. Wenn mehrere Container in einem einzigen Trainingsauftrag in dieses Verzeichnis schreiben, sollten sie sicherstellen, dass keine file/directory-Namen kollidieren. SageMaker AI fasst das Ergebnis in einer TAR-Datei zusammen und lädt es am Ende des Trainingsjobs auf S3 hoch.

  • /opt/ml/output/data – Ihr Algorithmus sollte Artefakte, die Sie speichern möchten, außer dem endgültigen Modell, in dieses Verzeichnis schreiben. SageMaker AI kopiert diese Daten als einzelnes Objekt im komprimierten TAR-Format an den S3-Speicherort, den Sie in der CreateTrainingJob-Anforderung angegeben haben. Wenn mehrere Container in einem einzigen Trainingsauftrag in dieses Verzeichnis schreiben, sollten sie sicherstellen, dass keine file/directory-Namen kollidieren. SageMaker AI fasst das Ergebnis in einer TAR-Datei zusammen und lädt es am Ende des Trainingsjobs auf S3 hoch.

  • /opt/ml/output/failure – Wenn das Training fehlschlägt, sollte Ihr Algorithmus nach Abschluss aller Algorithmusausgaben (z. B. der Protokollierung) die Fehlerbeschreibung in diese Datei schreiben. In einer DescribeTrainingJob-Antwort gibt SageMaker AI die ersten 1024 Zeichen aus dieser Datei als FailureReason zurück.

Sie können entweder einen S3-Allzweck-Bucket oder einen S3-Verzeichnis-Bucket zum Speichern Ihrer Trainingsausgabe angeben. Verzeichnis-Buckets verwenden die Speicherklasse Amazon S3 Express One Zone, die für Workloads oder leistungskritische Anwendungen konzipiert ist, die eine konsistente Latenz im einstelligen Millisekundenbereich erfordern. Wählen Sie den Bucket-Typ, der am besten zu Ihren Anwendungs- und Leistungsanforderungen passt. Weitere Informationen über S3-Verzeichnis-Buckets finden Sie unter Verzeichnis-Buckets im Benutzerhandbuch für Amazon Simple Storage Service.

Anmerkung

Sie können Ihre SageMaker-AI-Ausgabedaten in S3-Verzeichnis-Buckets nur mit serverseitiger Verschlüsselung mit von Amazon S3 verwalteten Schlüsseln (SSE-S3) verschlüsseln. Die serverseitige Verschlüsselung mit AWS KMS-Schlüsseln (SSE-KMS) wird derzeit für das Speichern von SageMaker-AI-Ausgabedaten in Verzeichnis-Buckets nicht unterstützt.