Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Réglage d'un modèle BlazingText
Le réglage de modèle automatique, ou réglage d'hyperparamètre, détecte la meilleure version d'un modèle en exécutant plusieurs tâches qui testent une plage d'hyperparamètres sur votre jeu de données. Vous choisissez les hyperparamètres réglables, une plage de valeurs pour chacun d'eux et une métrique d'objectif. Vous choisissez la métrique d'objectif parmi les métriques que calcule l'algorithme. Le réglage de modèle automatique recherche parmi les hyperparamètres choisis la combinaison de valeurs qui produira un modèle permettant d'optimiser la métrique d'objectif.
Pour plus d'informations sur le réglage de modèle, consultez Réglage automatique du modèle grâce à l' SageMaker IA.
Métriques calculées par l'algorithme BlazingText
L'algorithme Word2vec BlazingText (modes skipgram, cbow et batch_skipgram) porte sur une seule métrique durant l'entraînement : train:mean_rho. Cette métrique est calculée sur les ensembles de données de similarité lexicale de WS-353
L'algorithme de classification textuelle BlazingText (mode supervised) porte également sur une seule métrique durant l'entraînement : la métrique validation:accuracy. Utilisez ces métriques comme objectif lors du réglage des valeurs d'hyperparamètres pour l'algorithme de classification textuelle.
| Nom de la métrique | Description | Orientation de l'optimisation |
|---|---|---|
train:mean_rho |
Corrélation (rhô) moyenne (coefficient de corrélation de Spearman) pour les ensembles de données de similarité lexicale de WS-353 |
Agrandir |
validation:accuracy |
Précision de la classification pour l'ensemble de données de validation spécifié par l'utilisateur |
Agrandir |
Hyperparamètres BlazingText réglables
Hyperparamètres réglables pour l'algorithme Word2vec
Réglez un modèle Word2Vec BlazingText Amazon SageMaker AI à l’aide des hyperparamètres suivants. Les hyperparamètres ayant le plus grand impact sur les métriques d'objectif Word2vec sont les suivants : mode, learning_rate, window_size, vector_dim et negative_samples.
| Nom du paramètre | Type de paramètre | Plages ou valeurs recommandées |
|---|---|---|
batch_size |
|
[8-32] |
epochs |
|
[5-15] |
learning_rate |
|
Valeur min. : 0,005, Valeur max. : 0,01 |
min_count |
|
[0-100] |
mode |
|
[ |
negative_samples |
|
[5-25] |
sampling_threshold |
|
Valeur min. : 0,0001, Valeur max. : 0,001 |
vector_dim |
|
[32-300] |
window_size |
|
[1-10] |
Hyperparamètres réglables pour l'algorithme de classification textuelle
Réglez un modèle de classification textuelle BlazingText Amazon SageMaker AI à l’aide des hyperparamètres suivants.
| Nom du paramètre | Type de paramètre | Plages ou valeurs recommandées |
|---|---|---|
buckets |
|
[1 000 000-10 000 000] |
epochs |
|
[5-15] |
learning_rate |
|
Valeur min. : 0,005, Valeur max. : 0,01 |
min_count |
|
[0-100] |
vector_dim |
|
[32-300] |
word_ngrams |
|
[1-3] |