Cierre temporal de las políticas de escalado
Después de configurar el escalado automático, tiene las siguientes opciones si necesita investigar un problema sin que las políticas de escalado interfieran (escalado dinámico):
-
Suspenda temporalmente las actividades de escalado y, a continuación, reanúdelas. Para ello, llame al comando register-scalable-target de la CLI o a la acción de la API RegisterScalableTarget y especifique un valor booleano tanto para
DynamicScalingInSuspendedcomo paraDynamicScalingOutSuspended.En el siguiente ejemplo, se muestra cómo suspender las políticas de escalado para una variante denominada
, que se ejecuta en el punto de conexiónmy-variant.my-endpointaws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --suspended-state '{"DynamicScalingInSuspended":true,"DynamicScalingOutSuspended":true}' -
Evite que políticas de escalado de seguimiento de destino específicas se reduzcan horizontalmente en su variante desactivando la parte de reducción horizontal de la política. Este método evita que la política de escalado elimine instancias, a la vez que le permite crearlas según sea necesario.
Deshabilite temporalmente y, a continuación, habilite las actividades de reducción horizontal mediante la edición de la política con el comando de CLI put-scaling-policy o la acción de la API PutScalingPolicy, especificando un valor booleano para
DisableScaleIn.A continuación se muestra un ejemplo de configuración de seguimiento de destino para una política de escalado en la que se escalará horizontalmente, pero no se reducirá horizontalmente.
{ "TargetValue":70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn":true}