Refinamiento de un modelo en Studio
El refinamiento entrena un modelo previamente entrenado en un nuevo conjunto de datos sin tener que entrenarlo desde cero. Este proceso, también conocido como aprendizaje por transferencia, puede producir modelos precisos con conjuntos de datos más pequeños y con menos tiempo de entrenamiento. Para refinar los modelos fundacionales de JumpStart, navegue hasta una tarjeta de detalles del modelo en la interfaz de usuario de Studio. Para obtener más información sobre cómo abrir JumpStart en Studio, consulte Cómo abrir y utilizar JumpStart en Studio. Tras acceder a la tarjeta de detalles del modelo que prefiera, seleccione Entrenar en la esquina superior derecha. Tenga en cuenta que no todos los modelos están disponibles para su refinamiento.
importante
Algunos modelos fundacionales requieren la aceptación explícita de un acuerdo de licencia de usuario final (EULA) antes del refinamiento. Para obtener más información, consulte Aceptación del EULA en Amazon SageMaker Studio.
Ajustes de modelos
Cuando se utiliza un modelo fundacional de JumpStart previamente entrenado en Amazon SageMaker Studio, la ubicación del artefacto del modelo (URI de Amazon S3) se rellena de forma predeterminada. Para editar el URI predeterminado de Amazon S3, elija Introducir la ubicación del artefacto del modelo. No todos los modelos admiten cambiar la ubicación del artefacto del modelo.
Configuración de datos
En el campo Datos, proporcione un punto de URI de Amazon S3 a la ubicación del conjunto de datos de entrenamiento. El URI predeterminado de Amazon S3 apunta a un ejemplo de conjunto de datos de entrenamiento. Para editar el URI predeterminado de Amazon S3, seleccione Introducir conjunto de datos de entrenamiento y cambie el URI. Asegúrese de revisar la tarjeta de detalles del modelo en Amazon SageMaker Studio para obtener información sobre el formato de los datos de entrenamiento.
Hiperparámetros
Puede personalizar los hiperparámetros del trabajo de entrenamiento que se utilizan para ajustar el modelo. Los hiperparámetros disponibles para cada modelo ajustable varían según el modelo.
Los siguientes hiperparámetros son comunes entre los diversos modelos:
-
Época: una época es un ciclo que recorre todo el conjunto de datos. Varios intervalos completan un lote y, finalmente, varios lotes completan una época. Se ejecutan varias épocas hasta que la precisión del modelo alcanza un nivel aceptable o cuando la tasa de error cae por debajo de un nivel aceptable.
-
Tasa de aprendizaje: la cantidad que deben cambiar los valores entre épocas. A medida que se perfecciona el modelo, se modifican sus ponderaciones internas y se comprueban las tasas de error para ver si el modelo mejora. Una tasa de aprendizaje típica es de 0,1 o 0,01, donde 0,01 es un ajuste mucho menor y podría provocar que el entrenamiento tarde mucho en converger, mientras que 0,1 es mucho mayor y puede provocar que el entrenamiento se sobrepase. Es uno de los principales hiperparámetros que puede ajustar para entrenar su modelo. Tenga en cuenta que, en el caso de los modelos de texto, una tasa de aprendizaje mucho menor (5e-5 para BERT) puede dar como resultado un modelo más preciso.
-
Tamaño del lote: la cantidad de registros del conjunto de datos que se van a seleccionar para cada intervalo y que se van a enviar a las GPU para su entrenamiento.
Consulte las peticiones de la información sobre herramientas y la información adicional de la tarjeta de detalles del modelo en la interfaz de usuario de Studio para obtener más información sobre hiperparámetros específicos del modelo elegido.
Para obtener más información sobre hiperparámetros disponibles, consulte Hiperparámetros de refinamiento compatibles comunes.
Implementación
Especifique el tipo de instancia de entrenamiento y la ubicación del artefacto de salida para el trabajo de entrenamiento. Solo puede elegir entre instancias que sean compatibles con el modelo elegido en el refinamiento de la interfaz de usuario de Studio. La ubicación predeterminada del artefacto de salida es el bucket predeterminado de SageMaker AI. Para cambiar la ubicación del artefacto de salida, elija Introducir ubicación del artefacto de salida y cambie la URI de Amazon S3.
Seguridad
Especifique la configuración de seguridad que desea utilizar para el trabajo de entrenamiento, incluida el rol de IAM que SageMaker AI utiliza para entrenar el modelo, si el trabajo de entrenamiento debe conectarse a una nube privada virtual (VPC) y cualquier clave de cifrado para proteger sus datos.
Información adicional
En el campo Información adicional puede editar el nombre del trabajo de entrenamiento. También puede agregar y eliminar etiquetas en forma de pares clave-valor para organizar y categorizar sus trabajos de entrenamiento de refinamiento.
Tras proporcionar la información para la configuración de refinamiento, seleccione Enviar. Si el modelo fundacional previamente diseñado que ha decidido refinar requiere aceptación explícita de un acuerdo de licencia para el usuario final (EULA) antes del entrenamiento, el EULA aparece en una ventana emergente. Para aceptar los términos del EULA, elija Aceptar. Usted es el responsable de revisar y cumplir los términos de licencia aplicables y de asegurarse de que sean aceptables para su caso de uso antes de descargar o usar el modelo.