Come usare la Classificazione del testo - TensorFlow - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Come usare la Classificazione del testo - TensorFlow

L'algoritmo Classificazione del testo - Tensorflow classifica il testo in una delle etichette di classe di output. Le reti di deep learning come BERT sono estremamente accurate per la classificazione del testo. Esistono anche reti di deep learning addestrate su set di dati di testo di grandi dimensioni, come TextNet, che contiene più di 11 milioni di testi con circa 11.000 categorie. Dopo che una rete è stata addestrata con i dati TextNet, puoi perfezionare la rete su un set di dati con particolare attenzione per eseguire attività di classificazione del testo più specifiche. L’algoritmo Classificazione del testo - TensorFlow di Amazon SageMaker AI supporta l’apprendimento per trasferimento su molti modelli preaddestrati disponibili in TensorFlow Hub.

In base al numero di etichette di classe nei dati di addestramento, un livello di classificazione del testo è collegato al modello TensorFlow preaddestrato di tua scelta. Il livello di classificazione è costituito da uno livello dropout, un livello denso e un livello completamente connesso con regolarizzatore norma 2 inizializzato con pesi casuali. Puoi modificare i valori degli iperparametri per la percentuale di dropout del livello di dropout e il fattore di regolarizzazione L2 per il livello denso.

Puoi ottimizzare l'intera rete (incluso il modello preaddestrato) o solo il livello di classificazione superiore in base ai nuovi dati di addestramento. Con questo metodo di trasferimento dell'addestramento, puoi eseguire l’addestramento di set di dati più piccoli.