Controllare lo stato di un’attività di dimensionamento descrivendo le attività di dimensionamento - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Controllare lo stato di un’attività di dimensionamento descrivendo le attività di dimensionamento

È possibile controllare lo stato di un’attività di dimensionamento per un endpoint con dimensionamento automatico descrivendo le attività di dimensionamento. Application Auto Scaling fornisce informazioni descrittive sulle attività di dimensionamento nel namespace specificato per le sei settimane precedenti. Per ulteriori informazioni, consulta Attività di dimensionamento per Application Auto Scaling nella Guida per l’utente di Application Auto Scaling.

Per verificare lo stato di un'attività di ridimensionamento, utilizzate il describe-scaling-activitiescomando. Non è possibile controllare lo stato di un’attività di dimensionamento utilizzando la console.

Descrivere le attività di dimensionamento (AWS CLI)

Per descrivere le attività di scalabilità per tutte le risorse SageMaker AI registrate con Application Auto Scaling, usa describe-scaling-activitiesil comando, sagemaker specificando l'opzione. --service-namespace

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Per descrivere le attività di dimensionamento per una risorsa specifica, includi l’opzione --resource-id.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

L’esempio seguente mostra l’output prodotto all’esecuzione di questo comando.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identificare attività di dimensionamento automatico bloccate da quote di istanza (AWS CLI)

Quando esegui l’aumento orizzontale (aggiunta di altre istanze), potresti raggiungere la quota di istanze a livello di account. È possibile utilizzare il describe-scaling-activitiescomando per verificare se è stata raggiunta la quota di istanza. Quando superi la quota, il dimensionamento automatico si blocca.

Per verificare se hai raggiunto la quota di istanza, usa il describe-scaling-activitiescomando e specifica l'ID della risorsa per l'--resource-idopzione.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

All'interno della sintassi return, controlla le chiavi StatusCode e StatusMessage e i valori associati. StatusCode restituitiFailed. All'interno di StatusMessage è presente un messaggio che indica che è stata raggiunta la quota di servizio a livello di account. Di seguito è riportato un esempio di come tale messaggio potrebbe presentarsi:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contactAWSsupport to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }