Escalado automático de modelos de Amazon SageMaker AI
Amazon SageMaker AI admite escalado automático para los modelos alojados. El escalado automático ajusta dinámicamente el número de instancias aprovisionadas para un modelo en respuesta a los cambios en su carga de trabajo. Cuando la carga de trabajo aumenta, el escalado automático proporciona más instancias en línea. Cuando la carga de trabajo desciende, el escalado automático quita las instancias innecesarias, a fin de que no pague por las instancias aprovisionadas que no utiliza.
Temas
Información general sobre las políticas de escalado automático
Configuración del escalado automático de modelos con la consola
Comprobación del estado de una actividad de escalado describiendo las actividades de escalado
Utilización de CloudFormation para crear un apolítica de escalado
Actualización de puntos de conexión que utilizan el escalado automático
Eliminación de puntos de conexión configurados para el escalado automático