Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Registrieren eines Modells
Bevor Sie Ihrem Modell eine Skalierungsrichtlinie hinzufügen, müssen Sie Ihr Modell zunächst für Auto Scaling registrieren und die Skalierungsgrenzen für das Modell definieren.
Die folgenden Verfahren beschreiben, wie Sie ein Modell (Produktionsvariante) für Auto Scaling mithilfe der API AWS Command Line Interface (AWS CLI) oder Application Auto Scaling registrieren.
Themen
Registrieren eines Modells (AWS CLI)
Verwenden Sie den register-scalable-targetBefehl mit den folgenden Parametern, um Ihre Produktionsvariante zu registrieren:
-
--service-namespace– Stellen Sie diesen Wert aufsagemakerein. -
--resource-id-Die Ressourcenkennung für das Modell (insbesondere die Produktionsvariante). Für diesen Parameter lautet der Ressourcentypendpointund die eindeutige Kennung ist der Name der Produktionsvariante. Beispiel,endpoint/.my-endpoint/variant/my-variant -
--scalable-dimension– Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCountein. -
--min-capacity– Mindestanzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der fürmax-capacityangegebene Wert. -
--max-capacity– Höchstzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der fürmin-capacityangegebene Wert.
Das folgende Beispiel zeigt, wie Sie eine Variante mit dem Namen registrieren, die auf dem Endpunkt my-variant ausgeführt wird und dynamisch skaliert werden kann, um eine bis acht Instances zu erhalten.my-endpoint
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1\ --max-capacity8
Ein Modell registrieren (Application Auto Scaling Anwendungen-API)
Um Ihr Modell bei Application Auto Scaling zu registrieren, verwenden Sie die API-Aktion RegisterScalableTarget Application Auto Scaling mit den folgenden Parametern:
-
ServiceNamespace– Stellen Sie diesen Wert aufsagemakerein. -
ResourceID-Die Ressourcenkennung für die Produktionsvariante. Für diesen Parameter ist der Ressourcentypendpointund die eindeutige Kennung ist der Name der Variante. Zum Beispielendpoint/.my-endpoint/variant/my-variant -
ScalableDimension– Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCountein. -
MinCapacity– Mindestanzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der fürMaxCapacityangegebene Wert. -
MaxCapacity– Höchstzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der fürMinCapacityangegebene Wert.
Das folgende Beispiel zeigt, wie Sie eine Variante mit dem Namen registrieren, die auf dem Endpunkt my-variant ausgeführt wird und dynamisch skaliert werden kann, um eine bis acht Instances zu erhalten.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1, "MaxCapacity":8}