Fonctionnement Comment démarrer Exemples de blocs-notes

Amazon SageMaker Inference Recommender

Amazon SageMaker Inference Recommender est une fonctionnalité d’Amazon SageMaker AI. Elle réduit le temps nécessaire à la mise en production des modèles de machine learning (ML) en automatisant les tests de charge et le réglage des modèles sur les instances de ML SageMaker AI. Vous pouvez utiliser Inference Recommender pour déployer votre modèle sur un point de terminaison d’inférence en temps réel ou sans serveur qui offre les meilleures performances au moindre coût. Inference Recommender vous aide à sélectionner le meilleur type d’instance et la meilleure configuration pour vos modèles et charges de travail de ML. Elle prend en compte des facteurs tels que le nombre d’instances, les paramètres du conteneur, les optimisations du modèle, la simultanéité maximale et la taille de la mémoire.

Amazon SageMaker Inference Recommender ne vous facture que les instances utilisées pendant l’exécution de vos tâches.

Fonctionnement

Pour utiliser Amazon SageMaker Inference Recommender, vous pouvez créer un modèle SageMaker AI ou enregistrer un modèle dans le registre de modèles SageMaker avec les artefacts de votre modèle. Utilisez le kit AWS SDK pour Python (Boto3) ou la console SageMaker AI pour exécuter des tâches d’analyse comparative pour différentes configurations de points de terminaison SageMaker AI. Les tâches Inference Recommender vous aident à collecter et à visualiser des métriques de performance et d’utilisation des ressources afin de vous aider à déterminer le type de point de terminaison et la configuration à choisir.

Comment démarrer

Si vous utilisez pour la première fois Amazon SageMaker Inference Recommender, nous vous recommandons de procéder comme suit :

Lisez la section Conditions préalables pour utiliser Amazon SageMaker Inference Recommender pour vous assurer que vous avez satisfait aux exigences d’utilisation d’Amazon SageMaker Inference Recommender.
Lisez la section Tâches de recommandation avec Amazon SageMaker Inference Recommender pour lancer vos premières tâches de recommandation Inference Recommender.
Découvrez l’exemple de bloc-notes Jupyter Amazon SageMaker Inference Recommender, ou consultez les exemples de blocs-notes présentés dans la section suivante.

Exemples de blocs-notes

Les exemples de blocs-notes Jupyter suivants peuvent vous aider à gérer les flux de travail pour plusieurs cas d’utilisation dans Inference Recommender :

Si vous voulez un bloc-notes d’introduction qui évalue un modèle TensorFlow, consultez le bloc-notes SageMaker Inference Recommender TensorFlow.
Si vous souhaitez évaluer un modèle HuggingFace, consultez le bloc-notes SageMaker Inference Recommender for HuggingFace (SageMaker Inference Recommender pour HuggingFace).
Si vous souhaitez évaluer un modèle XGBoost, consultez le bloc-notes SageMaker Inference Recommender XGBoost.
Si vous souhaitez vérifier les métriques CloudWatch pour vos tâches Inference Recommender, consultez le bloc-notes SageMaker Inference Recommender CloudWatch metrics (Métriques SageMaker Inference Recommender CloudWatch).

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Options d’évaluation du modèle

Prérequis