BlazingText-Hyperparameter
Wenn Sie einen Trainingsauftrag mit einer CreateTrainingJob Anforderung beginnen, geben Sie einen Trainingsalgorithmus an. Sie können außerdem algorithmusspezifische Hyperparameter als Zeichenfolge-zu-Zeichenfolge-Zuweisungen angeben. Die Hyperparameter für den BlazingText-Algorithmus hängen davon ab, welchen Modus Sie verwenden: Word2Vec (unüberwacht) und Textklassifizierung (überwacht).
Word2Vec-Hyperparameter
Die folgende Tabelle listet die Hyperparameter für den BlazingText Word2Vec-Trainingsalgorithmus auf, der von Amazon SageMaker AI bereitgestellt wird.
| Name des Parameters | Beschreibung |
|---|---|
mode |
Die für das Training verwendete Word2vec-Architektur. Erforderlich Gültige Werte: |
batch_size |
Die Größe jedes Stapels, wenn Optional Gültige Werte: Positive Ganzzahl Standardwert: 11 |
buckets |
Die Anzahl von Hash-Buckets für Teilwörter. Optional Gültige Werte: positive Ganzzahl Standardwert: 2000000 |
epochs |
Die Anzahl von abgeschlossenen Durchläufe durch das Trainingsdaten. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
evaluation |
Ob das Trainingsmodell mit dem WordSimilarity-353-Test Optional Gültige Werte: (Boolescher Wert) Standardwert: |
learning_rate |
Die für Parameteraktualisierungen verwendete Schrittgröße. Optional Gültige Werte: Positive Gleitkommazahl Standardwert: 0.05 |
min_char |
Die Mindestanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter. Optional Gültige Werte: positive Ganzzahl Standardwert: 3 |
min_count |
Wörter, die weniger als Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
max_char |
Die Höchstanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter. Optional Gültige Werte: positive Ganzzahl Standardwert: 6 |
negative_samples |
Die Anzahl der negativen Beispiele für die Strategie des Austauschs von Negativbeispielen. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
sampling_threshold |
Der Schwellenwert für die Häufigkeit von Wörtern. Wörter, die mit höheren Frequenz in den Trainingsdaten erscheinen, werden nach dem Zufallsprinzip heruntergesampelt. Optional Gültige Werte: Positive Bruchzahl. Der empfohlene Bereich ist (0, 1e-3] Standardwert: 0.0001 |
subwords |
Gibt an, ob Teilworteinbettungen zu lernen sind oder nicht. Optional Gültige Werte: (Boolescher Wert) Standardwert: |
vector_dim |
Die Dimension der Wortvektoren, die der Algorithmus lernt. Optional Gültige Werte: Positive Ganzzahl Standardwert: 100 |
window_size |
Die Größe des Kontextfensters. Das Kontextfenster ist die Anzahl der Wörter, die das für das Training verwendete Zielwort umgeben. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
Textklassifizierungs-Hyperparameter
Die folgende Tabelle listet die Hyperparameter für den von Amazon SageMaker AI bereitgestellten Textklassifizierungstrainingsalgorithmus auf.
Anmerkung
Auch wenn einige der Parameter in den Textklassifizierungs- und Word2Vec-Modi gängig sind, haben sie möglicherweise je nach Kontext unterschiedliche Bedeutungen.
| Name des Parameters | Beschreibung |
|---|---|
mode |
Der Trainingsmodus Erforderlich Zulässige Werte: |
buckets |
Die Anzahl der Hash-Buckets für N-Gramm-Wörter. Optional Gültige Werte: Positive Ganzzahl Standardwert: 2000000 |
early_stopping |
Gibt an, ob das Training angehalten wird, wenn sich die Validierungsgenauigkeit nach einer Optional Gültige Werte: (Boolescher Wert) Standardwert: |
epochs |
Die maximale Anzahl abgeschlossener Durchläufe durch das Trainingsdaten. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
learning_rate |
Die für Parameteraktualisierungen verwendete Schrittgröße. Optional Gültige Werte: Positive Gleitkommazahl Standardwert: 0.05 |
min_count |
Wörter, die weniger als Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
min_epochs |
Die Mindestanzahl der Epochen, die trainiert werden sollen, bevor die Logik zum Early-Stopping aufgerufen wird. Optional Gültige Werte: Positive Ganzzahl Standardwert: 5 |
patience |
Die Anzahl der Epochen, die gewartet werden soll, bevor ein Early-Stopping durchgeführt wird, wenn keine Fortschritte hinsichtlich der festgelegten Validierung erfolgen. Nur verwendet, wenn Optional Gültige Werte: Positive Ganzzahl Standardwert: 4 |
vector_dim |
Die Dimension der Einbettungsebene. Optional Gültige Werte: Positive Ganzzahl Standardwert: 100 |
word_ngrams |
Die Anzahl der N-Gramm-Wort-Funktionen, die verwendet werden sollen. Optional Gültige Werte: Positive Ganzzahl Standardwert: 2 |