Anwenden einer Skalierungsrichtlinie
Nachdem Sie Ihr Modell registriert und eine Skalierungsrichtlinie definiert haben, wenden Sie die Skalierungsrichtlinie auf das registrierte Modell an. In diesem Abschnitt wird gezeigt, wie eine Skalierungsrichtlinie über die AWS Command Line Interface (AWS CLI) oder die Application Auto Scaling API angewendet wird.
Themen
Anwenden einer Skalierungsrichtlinie zur Zielnachverfolgung (AWS CLI)
Um eine Skalierungsrichtlinie auf Ihr Modell anzuwenden, verwenden Sie den AWS CLI-Befehl put-scaling-policy mit den folgenden Parametern:
-
--policy-name– Der Name der Skalierungsrichtlinie. -
--policy-type-Stellen Sie diesen Wert aufTargetTrackingScalingein. -
--resource-id- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Beispiel,endpoint/.my-endpoint/variant/my-variant -
--service-namespace-Stellen Sie diesen Wert aufsagemakerein. -
--scalable-dimension– Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCountein. -
--target-tracking-scaling-policy-configuration– Die Konfiguration der Skalierungsrichtlinie für die Zielnachverfolgung, die für das Modell verwendet werden soll.
Im folgenden Beispiel wird eine Skalierungsrichtlinie zur Zielnachverfolgung namens auf eine Variante namens my-scaling-policy angewendet, die auf dem Endpunkt my-endpoint ausgeführt wird. Geben Sie unter der Option my-variant--target-tracking-scaling-policy-configuration die config.json-Datei an, die Sie zuvor erstellt haben.
aws application-autoscaling put-scaling-policy \ --policy-namemy-scaling-policy\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Wenden Sie eine Skalierungsrichtlinie an (Application Auto Scaling API)
Um auf eine Variante mit der Application Auto Scaling API eine Skalierungsrichtlinie anzuwenden, verwenden Sie die Aktion PutScalingPolicy der API von Application Auto Scaling mit den folgenden Parametern:
-
PolicyName– Der Name der Skalierungsrichtlinie. -
ServiceNamespace-Stellen Sie diesen Wert aufsagemakerein. -
ResourceID- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Beispiel,endpoint/.my-endpoint/variant/my-variant -
ScalableDimension-Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCountein. -
PolicyType-Stellen Sie diesen Wert aufTargetTrackingScalingein. -
TargetTrackingScalingPolicyConfiguration-Die für die Variante zu verwendende Konfiguration der Skalierungsrichtlinie für die Zielverfolgung.
Im folgenden Beispiel wird eine Skalierungsrichtlinie zur Zielnachverfolgung namens auf eine Variante namens my-scaling-policy angewendet, die auf dem Endpunkt my-endpoint ausgeführt wird. Die Richtlinienkonfiguration hält die durchschnittlichen Aufrufe pro Instance bei 70.my-variant
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }