Entrenamiento automático de modelos en su flujo de datos - Amazon SageMaker AI

Entrenamiento automático de modelos en su flujo de datos

Puede usar el piloto automático de Amazon SageMaker para entrenar, ajustar e implementar modelos automáticamente a partir de los datos que ha transformado en su flujo de datos. El piloto automático de Amazon SageMaker puede utilizar varios algoritmos y usar el que mejor funcione con sus datos. Para obtener más información acerca del piloto automático de Amazon SageMaker, consulte Piloto automático de SageMaker.

Cuando entrena y ajusta un modelo, Data Wrangler exporta sus datos a una ubicación de Amazon S3 en la que el piloto automático de Amazon SageMaker puede acceder a ellos.

Para preparar e implementar un modelo, elija un nodo en el flujo de Data Wrangler y elija Exportar y entrenar en la vista previa de los datos. Puede utilizar este método para ver su conjunto de datos antes de decidir entrenar un modelo con él.

También puede entrenar e implementar un modelo directamente desde su flujo de datos.

El siguiente procedimiento prepara e implementa un modelo a partir del flujo de datos. En el caso de los flujos de Data Wrangler con transformaciones de varias filas, no puede utilizar las transformaciones del flujo de Data Wrangler al implementar el modelo. Puede utilizar el siguiente procedimiento para procesar los datos antes de utilizarlos para realizar una inferencia.

Para entrenar e implementar un modelo directamente desde el flujo de datos, haga lo siguiente.

  1. Seleccione el signo + situado junto al nodo que contiene los datos de entrenamiento.

  2. Elija el Modelo de entrenamiento.

  3. De forma opcional, puede especificar un identificador o una clave de AWS KMS. Para obtener más información sobre la creación y el control de claves criptográficas para proteger sus datos, consulte AWS Key Management Service.

  4. Elija Exportar y entrena.

  5. Después de que el piloto automático de Amazon SageMaker entrene el modelo con los datos exportados por Data Wrangler, especifique un nombre en Nombre del experimento.

  6. En Datos de entrada, seleccione Vista previa para comprobar que Data Wrangler haya exportado correctamente los datos al piloto automático de Amazon SageMaker.

  7. En Destino, elija la columna de destino.

  8. De forma opcional, en la Ubicación de S3 en Datos de salida, puede especificar una ubicación de Amazon S3 distinta de la ubicación predeterminada.

  9. Elija Siguiente: método de entrenamiento.

  10. Elija un método de entrenamiento. Para obtener más información, consulte Modelos de entrenamiento.

  11. De forma opcional, en Implementación automática de punto de conexión, puede especificar un nombre para el punto de conexión.

  12. En Opción de implementación, elija un método de implementación. Puede optar por realizar la implementación con o sin las transformaciones que ha realizado en sus datos.

    importante

    No puede implementar un modelo de piloto automático de Amazon SageMaker con las transformaciones que ha realizado en su flujo de Data Wrangler. Para obtener más información sobre esas transformaciones, consulte Exportación a un punto de conexión de inferencia.

  13. Elija Siguiente: revisar y crear.

  14. Elija Create experiment (Crear experimento).

Para obtener más información acerca el entrenamiento del modelo y la implementación, consulte Creación de trabajos de regresión o clasificación para datos tabulares mediante la API de AutoML. El piloto automático le muestra análisis sobre el rendimiento del mejor modelo. Para obtener más información sobre el rendimiento del modelo, consulte Visualización de un informe de rendimiento sobre el modelo de Piloto automático.