Cómo funciona Text Classification - TensorFlow - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cómo funciona Text Classification - TensorFlow

El algoritmo Text Classification - TensorFlow toma el texto y lo clasifica en una de las etiquetas de clase de salida. Las redes de aprendizaje profundo, como BERT, son muy precisas a la hora de clasificar textos. También hay redes de aprendizaje profundo que se entrenan con conjuntos de datos de texto de gran tamaño, como TextNet, que tiene más de 11 millones de textos repartidos en unas 11 000 categorías. Tras entrenar una red con datos de TextNet, puede ajustarla en un conjunto de datos, con el objetivo principal de llevar a cabo tareas de clasificación de texto más específicas. El algoritmo Text Classification - TensorFlow en Amazon SageMaker AI es compatible con el aprendizaje por transferencia en muchos modelos previamente entrenados disponibles en TensorFlow Hub.

En función del número de etiquetas de clase en los datos de entrenamiento, se asocia una capa de clasificación de texto al modelo prentrenado de TensorFlow que usted elija. La capa de clasificación está compuesta por una capa de eliminación, una capa densa y una capa totalmente conectada con regularización L2, y se inicia con ponderaciones aleatorias. Puede cambiar los valores de los hiperparámetros de la tasa de eliminación (en la capa de eliminación) y el factor de regularización L2 (en la capa densa).

Puede ajustar toda la red (lo que incluye el modelo prentrenado) o solo la capa de clasificación superior en los nuevos datos de entrenamiento. Con este método de aprendizaje por transferencia, es posible llevar a cabo el entrenamiento con conjuntos de datos más pequeños.