Fonctionnement de Text Classification - TensorFlow - Amazon SageMaker AI

Fonctionnement de Text Classification - TensorFlow

L'algorithme Text Classification - TensorFlow prend du texte et le classe dans l'une des étiquettes de classe en sortie. Les réseaux de deep learning tels que BERT sont très précis pour la classification textuelle. Il existe également des réseaux de deep learning qui sont entraînés sur de grands jeux de données de type TextNet, qui contient plus de 11 millions de textes dans environ 11 000 catégories. Une fois qu'un réseau a été entraîné avec les données de TextNet, vous pouvez affiner le réseau sur un jeu de données en mettant l'accent sur l'exécution de tâches de classification de texte plus spécifiques. L’algorithme Text Classification - TensorFlow dans Amazon SageMaker AI prend en charge l’apprentissage par transfert sur de nombreux modèles pré-entraînés disponibles dans le hub TensorFlow.

En fonction du nombre d'étiquettes de classe figurant dans vos données d'entraînement, une couche de classification de texte est attachée au modèle TensorFlow pré-entraîné de votre choix. La couche de classification se compose d'une couche d'abandon, d'une couche dense et d'une couche entièrement connectée avec une régularisation à 2 normes, et est initialisé avec des pondérations aléatoires. Vous pouvez modifier les valeurs d'hyperparamètre pour le taux d'abandon de la couche d'abandon et le facteur de régularisation L2 pour la couche dense.

Vous pouvez affiner le réseau entier (y compris le modèle pré-entraîné) ou uniquement la couche de classification supérieure sur les nouvelles données d'entraînement. Avec cette méthode d'apprentissage par transfert, un entraînement avec des jeux de données plus petits est possible.