Controllare lo stato di un’attività di dimensionamento descrivendo le attività di dimensionamento - Amazon SageMaker AI

Controllare lo stato di un’attività di dimensionamento descrivendo le attività di dimensionamento

È possibile controllare lo stato di un’attività di dimensionamento per un endpoint con dimensionamento automatico descrivendo le attività di dimensionamento. Application Auto Scaling fornisce informazioni descrittive sulle attività di dimensionamento nel namespace specificato per le sei settimane precedenti. Per ulteriori informazioni, consulta Attività di dimensionamento per Application Auto Scaling nella Guida per l’utente di Application Auto Scaling.

Per controllare lo stato di un’attività di dimensionamento, utilizza il comando describe-scaling-activities. Non è possibile controllare lo stato di un’attività di dimensionamento utilizzando la console.

Descrivere le attività di dimensionamento (AWS CLI)

Per descrivere le attività di dimensionamento per tutte le risorse SageMaker AI registrate con Application Auto Scaling, utilizza il comando describe-scaling-activities specificando sagemaker per l’opzione --service-namespace.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Per descrivere le attività di dimensionamento per una risorsa specifica, includi l’opzione --resource-id.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

L’esempio seguente mostra l’output prodotto all’esecuzione di questo comando.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identificare attività di dimensionamento automatico bloccate da quote di istanza (AWS CLI)

Quando esegui l’aumento orizzontale (aggiunta di altre istanze), potresti raggiungere la quota di istanze a livello di account. È possibile utilizzare il comando describe-scaling-activities per verificare se hai raggiunto la quota di istanze. Quando superi la quota, il dimensionamento automatico si blocca.

Per verificare se hai raggiunto la quota di istanze, utilizza il comando describe-scaling-activities e specifica l’ID di risorsa per l’opzione --resource-id.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

All’interno della sintassi restituita, controlla le chiavi StatusCode e StatusMessage e i valori associati. StatusCode restituisce Failed. All'interno di StatusMessage è presente un messaggio che indica che è stata raggiunta la quota di servizio a livello di account. Di seguito è riportato un esempio di come tale messaggio potrebbe presentarsi:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }