Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Enregistrement d’un modèle
Avant d’ajouter une stratégie de mise à l’échelle à votre modèle, vous devez d’abord enregistrer votre modèle pour l’autoscaling et définir les limites de mise à l’échelle du modèle.
Les procédures suivantes expliquent comment enregistrer un modèle (variante de production) pour le dimensionnement automatique à l'aide de l'API AWS Command Line Interface (AWS CLI) ou Application Auto Scaling.
Rubriques
Enregistrement d’un modèle (AWS CLI)
Pour enregistrer votre variante de production, utilisez la register-scalable-targetcommande avec les paramètres suivants :
-
--service-namespace-Définissez cette valeur sursagemaker. -
--resource-id- L’identifiant de la ressource pour le modèle (plus précisément, la variante de production). Pour ce paramètre, le type de ressource estendpointet l’identifiant unique est le nom de la variante de production. Par exemple,endpoint/.my-endpoint/variant/my-variant -
--scalable-dimension-Définissez cette valeur sursagemaker:variant:DesiredInstanceCount. -
--min-capacity: nombre minimal d’instances. Cette valeur doit être au moins égale à 1 et être inférieure ou égale à celle spécifiée pourmax-capacity. -
--max-capacity: nombre maximal d’instances. Cette valeur doit être au moins égale à 1 et être supérieure ou égale à celle spécifiée pourmin-capacity.
L’exemple suivant montre comment enregistrer une variante nommée , exécutée sur le point de terminaison my-variant, qui peut être mise à l’échelle de façon dynamique pour avoir de 1 à 8 instances.my-endpoint
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1\ --max-capacity8
Enregistrement d’un modèle (API Application Auto Scaling)
Pour enregistrer votre modèle avec Application Auto Scaling, utilisez l'opération d'API Application Auto Scaling RegisterScalableTarget avec les paramètres suivants :
-
ServiceNamespace-Définissez cette valeur sursagemaker. -
ResourceID- L’identifiant de la ressource pour la variante de production. Pour ce paramètre, le type de ressource estendpointet l’identifiant unique est le nom de la variante. Par exempleendpoint/.my-endpoint/variant/my-variant -
ScalableDimension-Définissez cette valeur sursagemaker:variant:DesiredInstanceCount. -
MinCapacity: nombre minimal d’instances. Cette valeur doit être au moins égale à 1 et être inférieure ou égale à celle spécifiée pourMaxCapacity. -
MaxCapacity: nombre maximal d’instances. Cette valeur doit être au moins égale à 1 et être supérieure ou égale à celle spécifiée pourMinCapacity.
L’exemple suivant montre comment enregistrer une variante de point de terminaison nommée , exécutée sur le point de terminaison my-variant, qui peut être mise à l’échelle de façon dynamique pour avoir de 1 à 8 instances.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1, "MaxCapacity":8}