Registrieren eines Modells - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Registrieren eines Modells

Bevor Sie Ihrem Modell eine Skalierungsrichtlinie hinzufügen, müssen Sie Ihr Modell zunächst für Auto Scaling registrieren und die Skalierungsgrenzen für das Modell definieren.

Die folgenden Verfahren beschreiben, wie Sie ein Modell (Produktionsvariante) für Auto Scaling mithilfe der API AWS Command Line Interface (AWS CLI) oder Application Auto Scaling registrieren.

Registrieren eines Modells (AWS CLI)

Verwenden Sie den register-scalable-targetBefehl mit den folgenden Parametern, um Ihre Produktionsvariante zu registrieren:

  • --service-namespace – Stellen Sie diesen Wert auf sagemaker ein.

  • --resource-id-Die Ressourcenkennung für das Modell (insbesondere die Produktionsvariante). Für diesen Parameter lautet der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Produktionsvariante. Beispiel, endpoint/my-endpoint/variant/my-variant.

  • --scalable-dimension – Stellen Sie diesen Wert auf sagemaker:variant:DesiredInstanceCount ein.

  • --min-capacity – Mindestanzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der für max-capacity angegebene Wert.

  • --max-capacity – Höchstzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der für min-capacity angegebene Wert.

Das folgende Beispiel zeigt, wie Sie eine Variante mit dem Namen my-variant registrieren, die auf dem Endpunkt my-endpoint ausgeführt wird und dynamisch skaliert werden kann, um eine bis acht Instances zu erhalten.

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

Ein Modell registrieren (Application Auto Scaling Anwendungen-API)

Um Ihr Modell bei Application Auto Scaling zu registrieren, verwenden Sie die API-Aktion RegisterScalableTarget Application Auto Scaling mit den folgenden Parametern:

  • ServiceNamespace – Stellen Sie diesen Wert auf sagemaker ein.

  • ResourceID-Die Ressourcenkennung für die Produktionsvariante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. Zum Beispiel endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension – Stellen Sie diesen Wert auf sagemaker:variant:DesiredInstanceCount ein.

  • MinCapacity – Mindestanzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der für MaxCapacity angegebene Wert.

  • MaxCapacity – Höchstzahl von Instances Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der für MinCapacity angegebene Wert.

Das folgende Beispiel zeigt, wie Sie eine Variante mit dem Namen my-variant registrieren, die auf dem Endpunkt my-endpoint ausgeführt wird und dynamisch skaliert werden kann, um eine bis acht Instances zu erhalten.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }