

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Escalado automático de los modelos de Amazon SageMaker AI
<a name="endpoint-auto-scaling"></a>

Amazon SageMaker AI admite el escalado automático (autoescalado) para sus modelos alojados. El *escalado automático* ajusta dinámicamente el número de instancias aprovisionadas para un modelo en respuesta a los cambios en su carga de trabajo. Cuando la carga de trabajo aumenta, el escalado automático proporciona más instancias en línea. Cuando la carga de trabajo desciende, el escalado automático quita las instancias innecesarias, a fin de que no pague por las instancias aprovisionadas que no utiliza. Para obtener más información sobre el uso de métricas por instancia para escalar las decisiones, consulte [Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia](monitoring-cloudwatch-enhanced-metrics.md) las [métricas mejoradas para los puntos de enlace de Amazon SageMaker AI.](https://aws.amazon.com/blogs/machine-learning/enhanced-metrics-for-amazon-sagemaker-ai-endpoints-deeper-visibility-for-better-performance/)

**Topics**
+ [Información general sobre las políticas de escalado automático](endpoint-auto-scaling-policy.md)
+ [Requisitos previos de escalado automático](endpoint-auto-scaling-prerequisites.md)
+ [Configuración del escalado automático de modelos con la consola](endpoint-auto-scaling-add-console.md)
+ [Registrar un modelo](endpoint-auto-scaling-add-policy.md)
+ [Definir una política de escalado](endpoint-auto-scaling-add-code-define.md)
+ [Aplicar una política de escalado](endpoint-auto-scaling-add-code-apply.md)
+ [Instrucciones para editar una política de escalado](endpoint-auto-scaling-edit.md)
+ [Cierre temporal de las políticas de escalado](endpoint-auto-scaling-suspend-scaling-activities.md)
+ [Eliminación de una política de escalado](endpoint-auto-scaling-delete.md)
+ [Comprobación del estado de una actividad de escalado describiendo las actividades de escalado](endpoint-scaling-query-history.md)
+ [Escalado de un punto de conexión a cero instancias](endpoint-auto-scaling-zero-instances.md)
+ [Prueba de carga de la configuración de escalado automático](endpoint-scaling-loadtest.md)
+ [Uso CloudFormation para crear una política de escalado](endpoint-scaling-cloudformation.md)
+ [Actualización de puntos de conexión que utilizan el escalado automático](endpoint-scaling-update.md)
+ [Eliminación de puntos de conexión configurados para el escalado automático](endpoint-delete-with-scaling.md)