LDA-Hyperparameter - Amazon SageMaker AI

LDA-Hyperparameter

In der Anforderung CreateTrainingJob geben Sie den Trainingsalgorithmus an. Sie können außerdem algorithmusspezifische Hyperparameter als Zeichenfolge-zu-Zeichenfolge-Zuweisungen angeben. In der folgenden Tabelle sind die Hyperparameter für den von Amazon SageMaker AI bereitgestellten LDA-Trainingsalgorithmus aufgeführt. Weitere Informationen finden Sie unter Funktionsweise von LDA.

Name des Parameters Beschreibung
num_topics

Die Anzahl der Themen, die per LDA innerhalb der Daten ermittelt werden sollen.

Erforderlich

Gültige Werte: positive Ganzzahl

feature_dim

Die Vokabulargröße des Eingabedokumentkorpus.

Erforderlich

Gültige Werte: positive Ganzzahl

mini_batch_size

Die Gesamtanzahl der Dokumente im Eingabedokumentkorpus.

Erforderlich

Gültige Werte: positive Ganzzahl

alpha0

Erstschätzung des Konzentrationsparameters: die Summe der Dirichlet-Priorelemente. Geringe Werte führen eher zu kleinen Themenmischungen, bei höheren Werten (über 1.0) werden einheitlichere Mischungen generiert.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 1.0

max_restarts

Die Anzahl der Neustarts, die während der ALS (Alternating Least Squares)-Spektralzerlegungsphase des Algorithmus ausgeführt werden. Damit lassen sich lokale Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 10

max_iterations

Die maximale Anzahl der Iterationen, die im Rahmen der ALS-Phase des Algorithmus ausgeführt werden sollen. Damit lassen sich Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 1000

tol

Die Zielfehlertoleranz für die ALS-Phase des Algorithmus. Damit lassen sich Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen.

Optional

Gültige Werte: Positive Gleitkommazahl

Standardwert: 1e-8