Variables d’environnement SageMaker AI et chemins par défaut des emplacements de stockage d’entraînement - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Variables d’environnement SageMaker AI et chemins par défaut des emplacements de stockage d’entraînement

Le tableau suivant récapitule les chemins d’entrée et de sortie pour les jeux de données d’entraînement, les points de contrôle, les artefacts de modèle et les sorties, gérés par la plateforme d’entraînement SageMaker.

Parcours local dans l'instance d'entraînement SageMaker Variable d’environnement SageMaker AI Objectif Lire à partir de S3 pendant le démarrage Lecture à partir de S3 lors d'un redémarrage ponctuel Écrit sur S3 pendant l'entraînement Écriture sur S3 lorsque la tâche est terminée

/opt/ml/input/data/channel_name1

SM_CHANNEL_NOM_CANAL

Lecture des données d’entraînement à partir des canaux d’entrée spécifiés via la classe Estimator du kit SageMaker AI Python SDK ou l’opération d’API CreateTrainingJob. Pour plus d’informations sur la façon de le spécifier dans votre script d’entraînement à l’aide du kit SageMaker Python SDK, consultez Préparer un script d’entraînement.

Oui Oui Non Non

/opt/ml/output/data2

SM_OUTPUT_DIR

Enregistrement de sorties telles que la perte, la précision, les couches intermédiaires, les pondérations, les dégradés, le biais et les sorties compatibles avec TensorBoard. Vous pouvez également enregistrer n'importe quelle sortie arbitraire en utilisant ce chemin. Notez qu'il s'agit d'un chemin différent de celui utilisé pour stocker l'artefact du modèle final /opt/ml/model/.

Non Non Non Oui

/opt/ml/model3

SM_MODEL_DIR

Stockage de l'artefact du modèle final. Il s’agit également du chemin à partir duquel l’artefact du modèle est déployé pour l’inférence en temps réel dans SageMaker AI Hosting.

Non Non Non Oui

/opt/ml/checkpoints4

-

Enregistrement des points de contrôle du modèle (l'état du modèle) pour reprendre l'entraînement à partir d'un certain point et récupérer après un événement imprévu ou des interruptions d'Entraînement ponctuel géré.

Oui Oui Oui Non

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

Copie de scripts d'entraînement, de bibliothèques supplémentaires et de dépendances.

Oui Oui Non Non

/tmp

-

Lecture ou écriture dans /tmp comme espace auxiliaire.

Non Non Non Non

1 channel_name permet de spécifier les noms de canal définis par l'utilisateur pour les entrées de données d'entraînement. Chaque tâche d'entraînement peut contenir plusieurs canaux d'entrée de données. Vous pouvez spécifier jusqu'à 20 canaux d'entrée par tâche d'entaînement. Notez que le temps de téléchargement des données à partir des canaux de données est compté dans le temps facturable. Pour plus d’informations sur les chemins d’entrée des données, consultez Mise à disposition d’informations d’entraînement par Amazon SageMaker AI. SageMaker AI prend également en charge trois types de modes d’entrée des données : Fichier, Fichier rapide et Canal. Pour en savoir plus sur les modes d’entrée des données pour l’entraînement dans SageMaker AI, consultez Accéder aux données d’entraînement.

2 SageMaker AI compresse et écrit les artefacts d’entraînement dans des fichiers TAR (tar.gz). Le temps de compression et de téléchargement est compté dans le temps facturable. Pour plus d’informations, consultez Traitement de la sortie d’entraînement par Amazon SageMaker AI.

3 SageMaker AI compresse et écrit l’artefact du modèle final dans un fichier TAR (tar.gz). Le temps de compression et de téléchargement est compté dans le temps facturable. Pour plus d’informations, consultez Traitement de la sortie d’entraînement par Amazon SageMaker AI.

4 Synchronisation avec Amazon S3 pendant l'entraînement. Écrivez tel quel sans compression dans des fichiers TAR. Pour plus d’informations, consultez Utilisation des points de contrôle dans Amazon SageMaker AI.