Vérification de l’état d’une activité de mise à l’échelle en décrivant les activités de mise à l’échelle - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vérification de l’état d’une activité de mise à l’échelle en décrivant les activités de mise à l’échelle

Vous pouvez vérifier l’état d’une activité de mise à l’échelle pour votre point de terminaison mis à l’échelle automatiquement en décrivant les activités de mise à l’échelle. Application Auto Scaling fournit des détails sur les activités de mise à l’échelle dans l’espace de noms spécifié des six semaines précédentes. Pour plus d’informations, consultez Activités de mise à l’échelle pour Application Auto Scaling dans le Guide de l’utilisateur Application Auto Scaling.

Pour vérifier l'état d'une activité de dimensionnement, utilisez la describe-scaling-activitiescommande. Vous ne pouvez pas vérifier l’état d’une activité de mise à l’échelle à l’aide de la console.

Description des activités de mise à l’échelle (AWS CLI)

Pour décrire les activités de dimensionnement pour toutes les ressources d' SageMaker IA enregistrées auprès d'Application Auto Scaling, utilisez la describe-scaling-activitiescommande en spécifiant sagemaker l'--service-namespaceoption.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Pour décrire les activités de mise à l’échelle pour une ressource spécifique, incluez l’option --resource-id.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

L’exemple suivant illustre la sortie produite lorsque vous exécutez cette commande.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identification des activités de mise à l’échelle bloquée à partir des quotas d’instance (AWS CLI)

Lorsque vous augmentez horizontalement (ajoutez d’autres instances), vous pouvez atteindre votre quota d’instances au niveau du compte. Vous pouvez utiliser la describe-scaling-activitiescommande pour vérifier si vous avez atteint votre quota d'instance. Si vous dépassez votre quota, l’autoscaling est bloqué.

Pour vérifier si vous avez atteint votre quota d'instance, utilisez la describe-scaling-activitiescommande et spécifiez l'ID de ressource pour l'--resource-idoption.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

Dans la syntaxe de retour, cochez les cases StatusCode et StatusMessage, ainsi que leurs valeurs associées.StatusCoderenvoie Failed. StatusMessage contient un message indiquant que le quota de service au niveau du compte a été atteint. Ce message devrait ressembler à l’exemple suivant :

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contactAWSsupport to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }