Régler un modèle RCF
Le réglage de modèle automatique, ou réglage d'hyperparamètre, détecte la meilleure version d'un modèle en exécutant plusieurs tâches qui testent une plage d'hyperparamètres sur votre jeu de données. Vous choisissez les hyperparamètres réglables, une plage de valeurs pour chacun d'eux et une métrique d'objectif. Vous choisissez la métrique d'objectif parmi les métriques que calcule l'algorithme. Le réglage de modèle automatique recherche parmi les hyperparamètres choisis la combinaison de valeurs qui produira un modèle permettant d'optimiser la métrique d'objectif.
L’algorithme RCF d’Amazon SageMaker AI est un algorithme de détection d’anomalie non supervisé qui nécessite un jeu de données de test étiquetées pour l’optimisation des hyperparamètres. Il calcule les scores d'anomalie dans les points de données de test, puis étiquette les points de données comme anormaux si leurs scores dépassent trois écarts types par rapport à la moyenne. Cette règle s'appelle la règle des trois sigmas. Le score F1 s'appuie sur l'écart entre les étiquettes calculées et les étiquettes réelles. La tâche de réglage des hyperparamètres recherche le modèle qui optimise ce score. La réussite de l’optimisation des hyperparamètres dépend de l’applicabilité de la règle des trois sigmas à le jeu de données de test.
Pour plus d'informations sur le réglage de modèle, consultez Réglage de modèle automatique avec SageMaker AI.
Métriques calculées par l'algorithme RCF
L'algorithme RCF calcule les métriques suivantes au cours de l'entraînement. Lors du réglage du modèle, choisissez cette métrique comme objectif.
| Nom de la métrique | Description | Orientation de l'optimisation |
|---|---|---|
test:f1 |
Score F1 sur le jeu de données de test, basé sur l’écart entre les étiquettes calculées et les étiquettes réelles. |
Agrandir |
Hyperparamètres RCF réglables
Vous pouvez régler un modèle RCF avec les hyperparamètres suivants.
| Nom du paramètre | Type de paramètre | Plages recommandées |
|---|---|---|
num_samples_per_tree |
IntegerParameterRanges |
Valeur min. : 1, valeur max. : 2048 |
num_trees |
IntegerParameterRanges |
Valeur min. : 50, valeur max. : 1000 |