Obtention d’instances potentielles instantanées - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Obtention d’instances potentielles instantanées

Inference Recommender peut également vous fournir une liste d’instances potentielles, ou de types d’instances susceptibles de convenir à votre modèle, sur la page de détails de votre modèle SageMaker AI. Inference Recommender effectue automatiquement une analyse comparative préliminaire par rapport à votre modèle afin que vous puissiez fournir les cinq principales instances potentielles. Comme il s’agit de recommandations préliminaires, nous vous recommandons d’exécuter d’autres tâches de recommandation d’instance pour obtenir des résultats plus précis.

Vous pouvez afficher la liste des instances potentielles de votre modèle par programmation à l’aide de l’API DescribeModel, du kit SageMaker Python SDK ou de la console SageMaker AI.

Note

Vous n’obtiendrez pas d’instances potentielles pour les modèles que vous avez créés dans SageMaker AI avant que cette fonctionnalité ne soit disponible.

Pour afficher les instances potentielles de votre modèle via la console, procédez comme suit :

  1. Accédez à la console SageMaker à l’adresse https://console.aws.amazon.com/sagemaker/.

  2. Dans le panneau de navigation de gauche, choisissez Inférence, puis Modèles.

  3. Dans la liste des modèles, choisissez votre modèle.

Sur la page de détails de votre modèle, accédez à la section Instances potentielles pour déployer le modèle. La capture d’écran suivante montre cette section.

Capture d’écran de la liste des instances potentielles sur la page de détails du modèle.

Dans cette section, vous pouvez afficher les instances potentielles optimisées en termes de coût, de débit et de latence pour le déploiement du modèle, ainsi que des informations supplémentaires pour chaque type d’instance, telles que la taille de la mémoire, le nombre de CPU et de GPU et le coût par heure.

Si vous décidez d’analyser un exemple de données utiles et d’exécuter une tâche de recommandation d’inférence complète pour votre modèle, vous pouvez démarrer une tâche de recommandation d’inférence par défaut à partir de cette page. Pour démarrer une tâche par défaut via la console, procédez comme suit :

  1. Sur la page de détails de votre modèle, dans la section Instances potentielles pour déployer le modèle, choisissez Exécuter la tâche Inference Recommender.

  2. Dans la boîte de dialogue qui apparaît, pour le compartiment S3 destiné à l’analyse comparative des données utiles, entrez l’emplacement Amazon S3 où vous avez stocké un exemple de données utiles pour votre modèle.

  3. Pour Type de contenu de la charge utile, entrez les types MIME pour vos données de charge utile.

  4. (Facultatif) Dans la section Compilation de modèle à l’aide de SageMaker Neo, pour la Configuration d’entrée de données, entrez une forme de données au format dictionnaire.

  5. Choisissez Exécuter la tâche.

Inference Recommender démarre la tâche et vous pouvez afficher la tâche et ses résultats sur la page de liste Inference Recommender dans la console SageMaker AI.

Si vous souhaitez exécuter une tâche avancée et effectuer des tests de charge personnalisés, ou si vous souhaitez configurer des réglages et des paramètres supplémentaires pour votre tâche, consultez Exécuter un test de charge personnalisé.