Asignación de las rutas de almacenamiento de entrenamiento administradas por Amazon SageMaker AI - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Asignación de las rutas de almacenamiento de entrenamiento administradas por Amazon SageMaker AI

Esta página proporciona un resumen de alto nivel sobre cómo la plataforma de entrenamiento SageMaker administra rutas de almacenamiento para conjuntos de datos de entrenamiento, artefactos de modelos, puntos de control y salidas entre el almacenamiento en la nube AWS y los trabajos de entrenamiento en SageMaker AI. A lo largo de esta guía, aprenderá a identificar las rutas predeterminadas establecidas por la plataforma SageMaker AI y cómo se pueden optimizar los canales de datos con sus orígenes de datos en Amazon Simple Storage Service (Amazon S3), FSx para Lustre y Amazon EFS. Para obtener más información acerca de los distintos modos de entrada de canales de datos y opciones de almacenamiento, consulte Configuración de trabajos de entrenamiento para tener acceso a los conjuntos de datos.

Información general sobre cómo SageMaker AI asigna las rutas de almacenamiento

En el siguiente diagrama se muestra un ejemplo de cómo SageMaker AI asigna las rutas de entrada y salida al ejecutar un trabajo de entrenamiento con la clase Estimator del SageMaker Python SDK.

Ejemplo de cómo SageMaker AI asigna las rutas entre el contenedor de trabajos de entrenamiento y el almacenamiento al ejecutar un trabajo de entrenamiento con la clase Estimator del SageMaker Python SDK y su método de ajuste

SageMaker AI asigna las rutas de almacenamiento entre un almacenamiento (como Amazon S3, Amazon FSx y Amazon EFS) y el contenedor de entrenamientos de SageMaker en función de las rutas y el modo de entrada especificados a través de un objeto Estimator de SageMaker AI. Para obtener más información sobre cómo SageMaker AI lee o escribe en las rutas y el objetivo de estas, consulte Variables de entorno de SageMaker AI y las rutas predeterminadas para las ubicaciones de almacenamiento de entrenamiento.

Puede utilizar OutputDataConfig en la API CreateTrainingJob para guardar los resultados del entrenamiento del modelo en un bucket de S3. Utilice la API ModelArtifacts para encontrar el bucket de S3 que incluye los artefactos de modelos. Consulte el bloc de notas abalone_build_train_deploy para ver un ejemplo de las rutas de salida y cómo se utilizan en las llamadas a la API.

Para obtener más información y ejemplos de cómo SageMaker AI administra el origen de datos, los modos de entrada y las rutas locales en instancias de entrenamiento de SageMaker, consulte Acceder a datos de entrenamiento.