Preaddestramento continuo (CPT) - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Preaddestramento continuo (CPT)

La formazione continua (CPT) è una tecnica di formazione che estende la fase di pre-formazione di un modello base esponendolo a testo aggiuntivo senza etichetta proveniente da domini o corpora specifici. A differenza della messa a punto supervisionata, che richiede coppie di input-output etichettate, il CPT si basa su documenti non elaborati per aiutare il modello ad acquisire una conoscenza più approfondita di nuovi domini, apprendere la terminologia e gli schemi di scrittura specifici del dominio e adattarsi a particolari tipi di contenuti o aree tematiche.

Questo approccio è particolarmente utile quando si dispone di grandi volumi (decine di miliardi di token) di dati di testo specifici del dominio, come documenti legali, letteratura medica, documentazione tecnica o contenuti aziendali proprietari, e si desidera che il modello sviluppi la fluidità nativa in quel dominio. In genere, dopo la fase CPT, il modello deve essere sottoposto a ulteriori fasi di ottimizzazione delle istruzioni per consentire al modello di utilizzare le nuove conoscenze acquisite e completare attività utili.

Modelli supportati

Il CPT è disponibile per i seguenti modelli Amazon Nova:

  • Nova 1.0 (Micro, Lite, Pro)

  • Nova 2.0 (versione leggera)

Quando usare Nova 1.0 rispetto a Nova 2.0

La famiglia di modelli Amazon Nova offre diversi punti operativi in termini di rapporto prezzo/prestazioni per ottimizzare precisione, velocità e costi.

Scegli Nova 2.0 quando hai bisogno di quanto segue:

  • Funzionalità di ragionamento avanzate per attività analitiche complesse

  • Prestazioni superiori nella codifica, nella matematica e nella risoluzione di problemi scientifici

  • Supporto per una maggiore durata del contesto

  • Migliori prestazioni multilingue

Scegliete Nova 1.0 quando si verifica quanto segue:

  • Il tuo caso d'uso richiede una comprensione linguistica standard senza ragionamenti avanzati.

  • Desiderate ottimizzare per ridurre i costi di formazione e inferenza.

  • Il tuo obiettivo è insegnare al modello conoscenze e comportamenti specifici del dominio piuttosto che compiti di ragionamento complessi.

  • Hai già convalidato le prestazioni su Nova 1.0 e non hai bisogno di funzionalità aggiuntive.

Nota

Il modello più grande non è sempre migliore. Considerate il compromesso tra costi e prestazioni e i vostri requisiti aziendali specifici nella scelta tra i modelli Nova 1.0 e Nova 2.0.