Utilisation de l’estimateur générique SageMaker AI pour étendre les conteneurs DLC prédéfinis - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de l’estimateur générique SageMaker AI pour étendre les conteneurs DLC prédéfinis

Vous pouvez personnaliser les conteneurs SageMaker AI prédéfinis ou les étendre pour gérer toutes les exigences fonctionnelles supplémentaires de votre algorithme ou modèle que l’image Docker AI SageMaker prédéfinie ne prend pas en charge. Pour apprendre comment étendre un conteneur précréé, consultez Étendre un conteneur précréé.

Pour étendre un conteneur prédéfini ou adapter votre propre conteneur à l’utilisation de la bibliothèque, vous devez utiliser l’une des images répertoriées dans Cadres de travail pris en charge.

Note

À partir de TensorFlow 2.4.1 et PyTorch 1.8.1, les DLC de cadre SageMaker AI prennent en charge les types d’instances compatibles EFA. Nous vous recommandons d’utiliser les images DLC contenant TensorFlow 2.4.1 ou version ultérieure et PyTorch 1.8.1 ou version ultérieure.

Par exemple, si vous utilisez PyTorch, votre Dockerfile doit contenir une instruction FROM semblable à celle-ci :

# SageMaker AI PyTorch image FROM 763104351884.dkr.ecr.<aws-region>.amazonaws.com/pytorch-training:<image-tag> ENV PATH="/opt/ml/code:${PATH}" # this environment variable is used by the SageMaker AI PyTorch container to determine our user code directory. ENV SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/code # /opt/ml and all subdirectories are utilized by SageMaker AI, use the /code subdirectory to store your user code. COPY train.py /opt/ml/code/train.py # Defines cifar10.py as script entrypoint ENV SAGEMAKER_PROGRAM train.py

Vous pouvez également personnaliser votre propre conteneur Docker pour qu’il fonctionne avec SageMaker AI à l’aide de la boîte à outils d’entraînement SageMaker et du fichier binaire de la bibliothèque SageMaker AI de parallélisme distribué des données. Pour plus d’informations, consultez les instructions de la section suivante.