Variables de entorno de SageMaker AI y las rutas predeterminadas para las ubicaciones de almacenamiento de entrenamiento - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Variables de entorno de SageMaker AI y las rutas predeterminadas para las ubicaciones de almacenamiento de entrenamiento

En la siguiente tabla se resumen las rutas de entrada y salida para conjuntos de datos de entrenamiento, puntos de comprobación, artefactos de modelos y salidas, administrados por la plataforma de entrenamiento de SageMaker.

Ruta local en la instancia de entrenamiento de SageMaker Variables de entorno de SageMaker AI Finalidad Lectura desde S3 durante el inicio Lectura desde S3 durante reinicio puntual Escritura en S3 durante el entrenamiento Escritura en S3 cuando finaliza el trabajo

/opt/ml/input/data/channel_name1

SM_CHANNEL_CHANNEL_NAME

Lectura de datos de entrenamiento de los canales de entrada especificados mediante la clase Estimator del SageMaker AI Python SDK o la operación de la API CreateTrainingJob. Para obtener más información sobre cómo especificarlo en el script de entrenamiento mediante el SDK de SageMaker Python, consulte Preparar un script de entrenamiento.

No No

/opt/ml/output/data2

SM_OUTPUT_DIR

Ahorro de salidas como pérdida, precisión, capas intermedias, pesos, gradientes, polarización y salidas compatibles con TensorBoard. También puede guardar cualquier salida arbitraria que desee utilizando esta ruta. Tenga en cuenta que esta es una ruta diferente a la que se usa para almacenar el artefacto /opt/ml/model/ final del modelo.

No No No

/opt/ml/model3

SM_MODEL_DIR

Almacenamiento del artefacto final del modelo. Esta es también la ruta desde la que se despliega el artefacto del modelo para la Inferencia en tiempo real en SageMaker AI Hosting.

No No No

/opt/ml/checkpoints4

-

Guardado de los puntos de control del modelo (el estado del modelo) para reanudar el entrenamiento a partir de un punto determinado y recuperarse de interrupciones inesperadas o de entrenamiento de spot administrado.

No

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

Copia de scripts de entrenamiento, bibliotecas adicionales y dependencias.

No No

/tmp

-

Lectura o escritura /tmp como espacio temporal.

No No No No

1 channel_name es el lugar donde se especifican nombres de canales definidos por el usuario para las entradas de datos de entrenamiento. Cada trabajo de entrenamiento puede contener varios canales de entrada de datos. Puede especificar hasta 20 canales de entrada de entrenamiento por trabajo. Tenga en cuenta que el tiempo de descarga de datos desde los canales de datos se incluye en el tiempo facturable. Para obtener más información sobre las rutas de entrada de datos, consulte Cómo Amazon SageMaker AI proporciona información de entrenamiento. Además, hay tres tipos de modos de entrada de datos que SageMaker AI admite: modo de archivo, FastFile y canalización. Para obtener más información sobre los modos de entrada de datos para el entrenamiento en SageMaker AI, consulte Acceso a datos de entrenamiento.

2 SageMaker AI comprime y escribe los artefactos de entrenamiento en archivos TAR (tar.gz). El tiempo de compresión y carga se incluye en el tiempo facturable. Para obtener más información, consulte Cómo Amazon SageMaker AI procesa la salida de entrenamiento.

3 SageMaker AI comprime y escribe el artefacto final del modelo en un archivo TAR (tar.gz). El tiempo de compresión y carga se incluye en el tiempo facturable. Para obtener más información, consulte Cómo Amazon SageMaker AI procesa la salida de entrenamiento.

4 Sincronice con Amazon S3 durante el entrenamiento. Escriba tal cual sin comprimir en archivos TAR. Para obtener más información, consulte Uso de Puntos de control en Amazon SageMaker AI.