Désactivation temporaire des stratégies de mise à l’échelle - Amazon SageMaker AI

Désactivation temporaire des stratégies de mise à l’échelle

Après avoir configuré l’autoscaling, vous disposez des options suivantes si vous devez enquêter sur un problème sans interférer avec les stratégies de mise à l’échelle (mise à l’échelle dynamique) :

  • Suspendez temporairement puis reprenez les activités de mise à l’échelle en appelant la commande de la CLI register-scalable-target ou l’action d’API RegisterScalableTarget, en spécifiant une valeur booléenne pour DynamicScalingInSuspended et DynamicScalingOutSuspended.

    L’exemple suivant montre comment suspendre les stratégies de mise à l’échelle pour une variante nommée my-variant, exécutée sur le point de terminaison my-endpoint.

    aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --suspended-state '{"DynamicScalingInSuspended":true,"DynamicScalingOutSuspended":true}'
  • Empêchez les stratégies spécifiques de mise à l’échelle du suivi des cibles de procéder à une réduction horizontale de votre variante en désactivant la partie de réduction horizontale de la stratégie. Cette méthode empêche la stratégie de mise à l’échelle de supprimer des instances, tout en autorisant leur création si nécessaire.

    Désactivez temporairement puis activez les activités de réduction horizontale en modifiant la stratégie à l’aide de la commande de la CLI put-scaling-policy ou de l’action d’API PutScalingPolicy, en spécifiant une valeur booléenne pour DisableScaleIn.

    Voici un exemple de configuration du suivi des cibles pour une stratégie de mise à l’échelle qui effectuera une augmentation horizontale, mais pas de réduction horizontale.

    { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn": true }