Application d’une stratégie de mise à l’échelle
Après avoir enregistré votre modèle et défini une stratégie de mise à l’échelle, appliquez cette stratégie au modèle enregistré. Cette section explique comment appliquer une stratégie de mise à l’échelle à l’aide de l’AWS Command Line Interface (AWS CLI) ou de l’API Application Auto Scaling.
Rubriques
Application d’une stratégie de mise à l’échelle avec suivi de cible (AWS CLI)
Pour appliquer une stratégie de mise à l’échelle à votre modèle, utilisez la commande put-scaling-policy de l’AWS CLI avec les paramètres suivants :
-
--policy-nameNom de la stratégie de mise à l’échelle. -
--policy-type-Définissez cette valeur surTargetTrackingScaling. -
--resource-id- L’identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource estendpointet l’identifiant unique est le nom de la variante. Par exemple,endpoint/.my-endpoint/variant/my-variant -
--service-namespace-Définissez cette valeur sursagemaker. -
--scalable-dimension-Définissez cette valeur sursagemaker:variant:DesiredInstanceCount. -
--target-tracking-scaling-policy-configuration: la configuration de la stratégie de mise à l’échelle du suivi des cibles à utiliser pour le modèle.
L’exemple suivant applique une stratégie de mise à l’échelle du suivi des cibles nommée à une variante nommée my-scaling-policy, exécutée sur le point de terminaison my-variant. Pour l’option my-endpoint--target-tracking-scaling-policy-configuration, spécifiez le fichier config.json que vous avez créé précédemment.
aws application-autoscaling put-scaling-policy \ --policy-namemy-scaling-policy\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Application d’une stratégie de mise à l’échelle (API Application Auto Scaling)
Pour appliquer une stratégie de mise à l’échelle à une variante à l’aide de l’API Application Auto Scaling, utilisez l’opération d’API Application Auto Scaling PutScalingPolicy avec les paramètres suivants :
-
PolicyNameNom de la stratégie de mise à l’échelle. -
ServiceNamespace-Définissez cette valeur sursagemaker. -
ResourceID- L’identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource estendpointet l’identifiant unique est le nom de la variante. Par exemple,endpoint/.my-endpoint/variant/my-variant -
ScalableDimension-Définissez cette valeur sursagemaker:variant:DesiredInstanceCount. -
PolicyType-Définissez cette valeur surTargetTrackingScaling. -
TargetTrackingScalingPolicyConfiguration: la configuration de la politique de mise à l’échelle avec suivi des cibles à utiliser pour la variante.
L’exemple suivant applique une stratégie de mise à l’échelle du suivi des cibles nommée à une variante nommée my-scaling-policy, exécutée sur le point de terminaison my-variant. La configuration de la stratégie maintient le nombre moyen d’invocations par instance à 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }