Versionshinweise zum Amazon SageMaker Training Compiler - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionshinweise zum Amazon SageMaker Training Compiler

Wichtig

Amazon Web Services (AWS) gibt bekannt, dass es keine neuen Versionen von SageMaker Training Compiler geben wird. Sie können den SageMaker Training Compiler weiterhin über die vorhandenen AWS Deep Learning Containers (DLCs) für SageMaker Training verwenden. Es ist wichtig zu beachten, dass auf die vorhandenen DLCs zwar weiterhin zugegriffen werden kann, sie jedoch gemäß der Framework-Supportrichtlinie für Deep-Learning-Container von AWS keine Patches oder Updates mehr erhalten.

In den folgenden Versionshinweisen finden Sie die neuesten Updates für Amazon SageMaker Training Compiler.

Versionshinweise zum SageMaker Training Compiler: 13. Februar 2023

Aktualisierungen der Währungen
  • Unterstützung für PyTorch v1.13.1 hinzugefügt

Fehlerbehebungen
  • Es wurde ein Problem mit den Rennbedingungen auf der GPU behoben, das bei einigen Modellen wie Vision Transformer (ViT) zu einem Verlust von NAN führte.

Weitere Änderungen
  • Der SageMaker Training Compiler verbessert die Leistung, indem PyTorch/XLA die Optimierer (wie SGD, Adam, AdamW) in torch.optim oder transformers.optimization mit ihren syncfree-Versionen (wie,,) automatisch überschreibt. torch_xla.amp.syncfree torch_xla.amp.syncfree.SGD torch_xla.amp.syncfree.Adam torch_xla.amp.syncfree.AdamW Sie müssen die Codezeilen, in denen Sie Optimizer in Ihrem Trainingsskript definieren, nicht ändern.

Migration zu AWS Deep Learning Containers

Diese Version hat die Benchmark-Tests bestanden und wurde auf den folgenden AWS Deep-Learning-Container migriert:

Versionshinweise zum SageMaker Training Compiler: 9. Januar 2023

Abwärtskompatible Änderungen

  • tf.keras.optimizers.Optimizerzeigt auf einen neuen Optimierer in TensorFlow 2.11.0 und höher. Die alten Optimierer wurden verschoben. tf.keras.optimizers.legacy Wenn Sie wie folgt vorgehen, kann es aufgrund der bahnbrechenden Änderung zu einem Fehlschlagen des Auftrags kommen.

    • Laden Sie Checkpoints aus einem alten Optimizer. Wir empfehlen Ihnen, zu den älteren Optimierern zu wechseln.

    • Verwenden Sie TensorFlow v1. Wir empfehlen Ihnen, auf TensorFlow v2 zu migrieren oder zu den älteren Optimierern zu wechseln, wenn Sie TensorFlow v1 weiterhin verwenden müssen.

    Eine detailliertere Liste der wichtigsten Änderungen aufgrund der Optimierer-Änderungen finden Sie in den offiziellen Versionshinweisen zu TensorFlow v2.11.0 im TensorFlow GitHub-Repository.

Migration zu AWS Deep Learning Containers

Diese Version hat die Benchmark-Tests bestanden und wurde auf den folgenden AWS Deep-Learning-Container migriert:

Versionshinweise zum SageMaker Training Compiler: 8. Dezember 2022

Fehlerbehebungen

Bekannte Probleme

  • Die unsachgemäße Verwendung von PyTorch/XLA-APIs in den Bildverarbeitungstransformatoren von Hugging Face kann zu Konvergenzproblemen führen.

Weitere Änderungen

Migration zu AWS Deep Learning Containers

Diese Version hat die Benchmark-Tests bestanden und wurde auf den folgenden AWS Deep-Learning-Container migriert:

Versionshinweise zum SageMaker Training Compiler: 4. Oktober 2022

Aktualisierungen der Währungen
  • Unterstützung für TensorFlow v2.10.0 hinzugefügt.

Weitere Änderungen
  • Hugging Face NLP-Modelle unter Verwendung der Transformers-Bibliothek zu den TensorFlow-Framework-Tests hinzugefügt. Informationen zu den getesteten Transformer-Modellen finden Sie unter. Getestete Modelle

Migration zu AWS Deep Learning Containers

Diese Version hat die Benchmark-Tests bestanden und wurde auf den folgenden AWS Deep-Learning-Container migriert:

Versionshinweise zum SageMaker Training Compiler: 1. September 2022

Aktualisierungen der Währungen
  • Unterstützung für Hugging Face Transformers v4.21.1 mit PyTorch v1.11.0 hinzugefügt.

Verbesserungen
Migration zu AWS Deep Learning Containers

Diese Version hat die Benchmark-Tests bestanden und wurde auf den folgenden AWS Deep-Learning-Container migriert:

Versionshinweise zum SageMaker Training Compiler: 14. Juni 2022

Neue Features
Migration zu AWS Deep Learning Containers

Diese Version hat die Benchmark-Tests bestanden und wurde auf den folgenden AWS Deep-Learning-Container migriert:

Versionshinweise zum SageMaker Training Compiler: 26. April 2022

Verbesserungen
  • Unterstützung für alle Bereiche hinzugefügt, in AWS-Regionen denen AWSDeep Learning Containers im Einsatz sind, mit Ausnahme der Regionen China.

Versionshinweise zum SageMaker Training Compiler: 12. April 2022

Aktualisierungen der Währungen
  • Unterstützung für Hugging Face Transformers v4.17.0 mit TensorFlow v2.6.3 und PyTorch v1.10.2 hinzugefügt.

Versionshinweise zum SageMaker Training Compiler: 21. Februar 2022

Verbesserungen
  • Der Benchmark-Test wurde abgeschlossen und die Trainingsbeschleunigung für die Instance-Typen bestätigt. ml.g4dn Eine vollständige Liste der getesteten ml Instances finden Sie unter. Unterstützte Instance-Typen

Versionshinweise zum SageMaker Training Compiler: 01. Dezember 2021

Neue Features
  • Der Amazon SageMaker Training Compiler wurde auf AWS der re:Invent 2021 vorgestellt.

Migration zu AWS Deep Learning Containers