Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Mise à l'échelle automatique des modèles Amazon SageMaker AI
Amazon SageMaker AI prend en charge le dimensionnement automatique (mise à l'échelle automatique) pour vos modèles hébergés. L’autoscaling ajuste dynamiquement le nombre d’instances allouées pour un modèle en réponse à des modifications de la charge de travail. Lorsque la charge de travail augmente, l’autoscaling met en ligne plus d’instances. Lorsque la charge de travail diminue, l’autoscaling supprime les instances inutiles pour que vous n’ayez pas à payer les instances allouées que vous n’utilisez pas. Pour plus d'informations sur l'utilisation de métriques par instance pour les décisions de dimensionnement, consultez Mesures améliorées d'Amazon SageMaker AI pour les points de terminaison d'inférence la section « Mesures améliorées pour les points de terminaison Amazon SageMaker AI