LDA-Hyperparameter
In der Anforderung CreateTrainingJob geben Sie den Trainingsalgorithmus an. Sie können außerdem algorithmusspezifische Hyperparameter als Zeichenfolge-zu-Zeichenfolge-Zuweisungen angeben. In der folgenden Tabelle sind die Hyperparameter für den von Amazon SageMaker AI bereitgestellten LDA-Trainingsalgorithmus aufgeführt. Weitere Informationen finden Sie unter Funktionsweise von LDA.
| Name des Parameters | Beschreibung |
|---|---|
num_topics |
Die Anzahl der Themen, die per LDA innerhalb der Daten ermittelt werden sollen. Erforderlich Gültige Werte: positive Ganzzahl |
feature_dim |
Die Vokabulargröße des Eingabedokumentkorpus. Erforderlich Gültige Werte: positive Ganzzahl |
mini_batch_size |
Die Gesamtanzahl der Dokumente im Eingabedokumentkorpus. Erforderlich Gültige Werte: positive Ganzzahl |
alpha0 |
Erstschätzung des Konzentrationsparameters: die Summe der Dirichlet-Priorelemente. Geringe Werte führen eher zu kleinen Themenmischungen, bei höheren Werten (über 1.0) werden einheitlichere Mischungen generiert. Optional Gültige Werte: Positive Gleitkommazahl Standardwert: 1.0 |
max_restarts |
Die Anzahl der Neustarts, die während der ALS (Alternating Least Squares)-Spektralzerlegungsphase des Algorithmus ausgeführt werden. Damit lassen sich lokale Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen. Optional Gültige Werte: Positive Ganzzahl Standardwert: 10 |
max_iterations |
Die maximale Anzahl der Iterationen, die im Rahmen der ALS-Phase des Algorithmus ausgeführt werden sollen. Damit lassen sich Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen. Optional Gültige Werte: Positive Ganzzahl Standardwert: 1000 |
tol |
Die Zielfehlertoleranz für die ALS-Phase des Algorithmus. Damit lassen sich Minima besserer Qualität ermitteln, jedoch auf Kosten weiterer Berechnungen; und im Allgemeinen sollte hier keine Anpassung erfolgen. Optional Gültige Werte: Positive Gleitkommazahl Standardwert: 1e-8 |