BlazingText-Hyperparameter - Amazon SageMaker AI

BlazingText-Hyperparameter

Wenn Sie einen Trainingsauftrag mit einer CreateTrainingJob Anforderung beginnen, geben Sie einen Trainingsalgorithmus an. Sie können außerdem algorithmusspezifische Hyperparameter als Zeichenfolge-zu-Zeichenfolge-Zuweisungen angeben. Die Hyperparameter für den BlazingText-Algorithmus hängen davon ab, welchen Modus Sie verwenden: Word2Vec (unüberwacht) und Textklassifizierung (überwacht).

Word2Vec-Hyperparameter

Die folgende Tabelle listet die Hyperparameter für den BlazingText Word2Vec-Trainingsalgorithmus auf, der von Amazon SageMaker AI bereitgestellt wird.

Name des Parameters Beschreibung
mode

Die für das Training verwendete Word2vec-Architektur.

Erforderlich

Gültige Werte: batch_skipgram, skipgram oder cbow

batch_size

Die Größe jedes Stapels, wenn mode auf batch_skipgram festgelegt ist. Festgelegt auf eine Zahl zwischen 10 und 20.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 11

buckets

Die Anzahl von Hash-Buckets für Teilwörter.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 2000000

epochs

Die Anzahl von abgeschlossenen Durchläufe durch das Trainingsdaten.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

evaluation

Ob das Trainingsmodell mit dem WordSimilarity-353-Test ausgewertet wird.

Optional

Gültige Werte: (Boolescher Wert) True oder False

Standardwert: True

learning_rate

Die für Parameteraktualisierungen verwendete Schrittgröße.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 0.05

min_char

Die Mindestanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 3

min_count

Wörter, die weniger als min_count-mal angezeigt werden, werden verworfen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

max_char

Die Höchstanzahl der Zeichen für N-Gramm-Zeichen/Teilwörter.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 6

negative_samples

Die Anzahl der negativen Beispiele für die Strategie des Austauschs von Negativbeispielen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

sampling_threshold

Der Schwellenwert für die Häufigkeit von Wörtern. Wörter, die mit höheren Frequenz in den Trainingsdaten erscheinen, werden nach dem Zufallsprinzip heruntergesampelt.

Optional

Gültige Werte: Positive Bruchzahl. Der empfohlene Bereich ist (0, 1e-3]

Standardwert: 0.0001

subwords

Gibt an, ob Teilworteinbettungen zu lernen sind oder nicht.

Optional

Gültige Werte: (Boolescher Wert) True oder False

Standardwert: False

vector_dim

Die Dimension der Wortvektoren, die der Algorithmus lernt.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 100

window_size

Die Größe des Kontextfensters. Das Kontextfenster ist die Anzahl der Wörter, die das für das Training verwendete Zielwort umgeben.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

Textklassifizierungs-Hyperparameter

Die folgende Tabelle listet die Hyperparameter für den von Amazon SageMaker AI bereitgestellten Textklassifizierungstrainingsalgorithmus auf.

Anmerkung

Auch wenn einige der Parameter in den Textklassifizierungs- und Word2Vec-Modi gängig sind, haben sie möglicherweise je nach Kontext unterschiedliche Bedeutungen.

Name des Parameters Beschreibung
mode

Der Trainingsmodus

Erforderlich

Zulässige Werte: supervised

buckets

Die Anzahl der Hash-Buckets für N-Gramm-Wörter.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 2000000

early_stopping

Gibt an, ob das Training angehalten wird, wenn sich die Validierungsgenauigkeit nach einer patience Reihe von Epochen nicht verbessert. Beachten Sie, dass ein Validierungskanal erforderlich ist, wenn ein Early-Stopping verwendet wird.

Optional

Gültige Werte: (Boolescher Wert) True oder False

Standardwert: False

epochs

Die maximale Anzahl abgeschlossener Durchläufe durch das Trainingsdaten.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

learning_rate

Die für Parameteraktualisierungen verwendete Schrittgröße.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 0.05

min_count

Wörter, die weniger als min_count-mal angezeigt werden, werden verworfen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

min_epochs

Die Mindestanzahl der Epochen, die trainiert werden sollen, bevor die Logik zum Early-Stopping aufgerufen wird.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5

patience

Die Anzahl der Epochen, die gewartet werden soll, bevor ein Early-Stopping durchgeführt wird, wenn keine Fortschritte hinsichtlich der festgelegten Validierung erfolgen. Nur verwendet, wenn early_stopping True ist.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 4

vector_dim

Die Dimension der Einbettungsebene.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 100

word_ngrams

Die Anzahl der N-Gramm-Wort-Funktionen, die verwendet werden sollen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 2