Optimieren eines Modells in Studio - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Optimieren eines Modells in Studio

Durch die Optimierung wird ein vortrainiertes Modell anhand eines neuen Datensatzes trainiert, ohne dass ein Training von Grund auf erforderlich ist. Dieser Prozess, der auch als Transferlernen bezeichnet wird, kann genaue Modelle mit kleineren Datensätzen und weniger Trainingszeit erzeugen. Um JumpStart Fundamentmodelle zu optimieren, navigieren Sie zu einer Modelldetailkarte in der Studio-Benutzeroberfläche. Weitere Informationen zum Öffnen JumpStart in Studio finden Sie unterIn Studio öffnen und verwenden JumpStart . Nachdem Sie zur Modelldetailkarte Ihrer Wahl navigiert haben, wählen Sie in der oberen rechten Ecke Trainieren aus. Beachten Sie, dass nicht für alle Modelle eine Optimierung verfügbar ist.

Wichtig

Einige Basismodelle erfordern vor der Optimierung die ausdrückliche Annahme einer Endbenutzer-Lizenzvereinbarung (EULA). Weitere Informationen finden Sie unter EULA-Akzeptanz in Amazon Studio SageMaker .

Modelleinstellungen

Wenn Sie ein vortrainiertes JumpStart Foundation-Modell in Amazon SageMaker Studio verwenden, wird der Speicherort des Modellartefakts (Amazon S3 S3-URI) standardmäßig aufgefüllt. Um die standardmäßige Amazon-S3-URI zu bearbeiten, wählen Sie Speicherort des Modellartefakts eingeben aus. Nicht alle Modelle unterstützen das Ändern des Speicherorts für Modellartefakte.

Dateneinstellungen

Geben Sie im Feld Daten einen Amazon-S3-URI ein, der auf den Speicherort Ihres Trainingsdatensatzes verweist. Der standardmäßige Amazon-S3-URI verweist auf einen Beispiel-Trainingsdatensatz. Um den standardmäßige Amazon-S3-URI zu bearbeiten, wählen Sie Trainingsdatensatz eingeben aus und ändern Sie den URI. Informationen zur Formatierung von Trainingsdaten finden Sie auf der Modelldetailkarte in Amazon SageMaker Studio.

Hyperparameter

Sie können die Hyperparameter des Trainingsauftrags anpassen, die zur Feinabstimmung des Modells verwendet werden. Die Hyperparameter, die für jedes optimierbare Modell verfügbar sind, unterscheiden sich je nach Modell.

Die folgenden Hyperparameter sind in Modellen üblich:

  • Epochen – Eine Epoche ist ein Zyklus durch den gesamten Datensatz. Mehrere Intervalle formen einen Batch und mehrere Batches formen eine Epoche. Es werden mehrere Epochen durchgeführt, bis die Genauigkeit des Modells ein akzeptables Niveau erreicht hat oder wenn die Fehlerquote unter ein akzeptables Niveau fällt.

  • Lernrate – Der Umfang, um den Werte zwischen den Epochen geändert werden sollten. Während der Optimierung des Modells werden seine internen Gewichtungen angepasst und die Fehlerquoten überprüft, um festzustellen, ob sich das Modell verbessert. Eine typische Lernrate liegt bei 0,1 oder 0,01, wobei 0,01 eine viel geringere Anpassung darstellt und dazu führen kann, dass das Training lange dauert, bis das Training konvergiert, wohingegen 0,1 viel größer ist und zu einem Überschwingen des Trainings führen kann. Dies ist einer der wichtigsten Hyperparameter, die Sie für das Training Ihres Modells anpassen können. Beachten Sie, dass bei Textmodellen eine viel geringere Lernrate (5e-5 für BERT) zu einem genaueren Modell führen kann.

  • Batchgröße — Die Anzahl der Datensätze aus dem Datensatz, die für jedes Intervall ausgewählt werden sollen, das GPUs zum Training an den gesendet werden soll.

Lesen Sie die QuickInfo-Prompts und zusätzlichen Informationen auf der Modelldetailkarte auf der Studio-Benutzeroberfläche, um mehr über Hyperparameter zu erfahren, die für das Modell Ihrer Wahl spezifisch sind.

Weitere Informationen über verfügbare Hyperparameter finden Sie unter Häufig unterstützte Hyperparameter bei der Optimierung.

Bereitstellung

Geben Sie den Typ der Trainingsinstanz und den Speicherort des Ausgabeartefakts für Ihren Trainingsjob an. Im Rahmen der Optimierung der Studio-Benutzeroberfläche können Sie nur aus Instances wählen, die mit dem Modell Ihrer Wahl kompatibel sind. Der standardmäßige Speicherort für Ausgabeartefakte ist der SageMaker AI-Standard-Bucket. Um den Speicherort des Ausgabeartefakts zu ändern, wählen Sie Standort des Ausgabeartefakts eingeben und ändern Sie den Amazon-S3-URI.

Sicherheit

Geben Sie die Sicherheitseinstellungen an, die für Ihren Schulungsjob verwendet werden sollen, einschließlich der IAM-Rolle, die SageMaker KI zum Trainieren Ihres Modells verwendet, ob Ihr Schulungsjob eine Verbindung zu einer Virtual Private Cloud (VPC) herstellen soll, und aller Verschlüsselungsschlüssel zum Schutz Ihrer Daten.

Zusätzliche Informationen

Im Feld Zusätzliche Informationen können Sie den Namen des Trainingsjobs bearbeiten. Sie können auch Tags in Form von Schlüssel-Wert-Paaren hinzufügen und entfernen, um Ihre Optimierungs-Trainingsjobs zu organisieren und zu kategorisieren.

Nachdem Sie die Informationen für Ihre Optimierungskonfiguration eingegeben haben, wählen Sie Absenden aus. Wenn das vortrainierte Basismodell, das Sie für die Optimierung ausgewählt haben, vor dem Training die ausdrückliche Zustimmung zu einer Endbenutzer-Lizenzvereinbarung (EULA) erfordert, wird die EULA in einem Popup-Fenster angezeigt. Um die Bedingungen der EULA zu akzeptieren, wählen Sie Akzeptieren aus. Sie sind dafür verantwortlich, alle geltenden Lizenzbedingungen zu überprüfen und einzuhalten sowie sicherzustellen, dass sie für Ihren Anwendungsfall akzeptabel sind, bevor Sie ein Model herunterladen oder verwenden.