Entrenamiento previo continuo (CPT) - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Entrenamiento previo continuo (CPT)

La formación previa continua (CPT) es una técnica de formación que amplía la fase de formación previa de un modelo básico al exponerlo a texto adicional sin etiquetar de dominios o corpus específicos. A diferencia de los ajustes supervisados, que requieren combinaciones de entradas y salidas etiquetadas, la CPT se entrena con documentos sin procesar para ayudar al modelo a adquirir un conocimiento más profundo de nuevos dominios, aprender terminología y patrones de escritura específicos de cada dominio y adaptarse a tipos de contenido o áreas temáticas particulares.

Este enfoque es particularmente valioso cuando se tienen grandes volúmenes (decenas de miles de millones de fichas) de datos de texto específicos de un dominio, como documentos legales, bibliografía médica, documentación técnica o contenido empresarial patentado, y se desea que el modelo desarrolle una fluidez nativa en ese dominio. Por lo general, después de la fase de CPT, el modelo necesita pasar por etapas adicionales de ajuste de las instrucciones para que el modelo pueda utilizar los conocimientos recién adquiridos y completar tareas útiles.

Modelos compatibles

El CPT está disponible para los siguientes modelos de Amazon Nova:

  • Nova 1.0 (Micro, Lite, Pro)

  • Nova 2.0 (Lite)

Cuándo usar Nova 1.0 en lugar de Nova 2.0

La familia de modelos Amazon Nova ofrece varios puntos operativos de relación precio-rendimiento para optimizar la precisión, la velocidad y el coste.

Elija Nova 2.0 cuando necesite lo siguiente:

  • Capacidades de razonamiento avanzadas para tareas analíticas complejas

  • Rendimiento superior en codificación, matemáticas y resolución de problemas científicos

  • Soporte de mayor longitud de contexto

  • Mejor rendimiento multilingüe

Elija Nova 1.0 cuando se dé lo siguiente:

  • Su caso de uso requiere una comprensión del lenguaje estándar sin un razonamiento avanzado.

  • Desea optimizarlo para reducir los costes de formación e inferencia.

  • Su objetivo es enseñar al modelo conocimientos y comportamientos específicos del dominio, en lugar de realizar tareas de razonamiento complejas.

  • Ya ha validado el rendimiento en Nova 1.0 y no necesita capacidades adicionales.

nota

El modelo más grande no siempre es mejor. Tenga en cuenta la relación costo-rendimiento y los requisitos específicos de su empresa al seleccionar entre los modelos Nova 1.0 y Nova 2.0.