Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Barreras de protección de implementación para actualizar modelos en producción
Las barreras de protección de implementación son un conjunto de opciones de implementación de modelos en la inferencia de Amazon SageMaker AI para actualizar sus modelos de machine learning en producción. Con las opciones de implementación totalmente gestionadas, puede controlar el cambio del modelo actual en producción a uno nuevo. Los modos de cambio de tráfico en las implementaciones azul/verde, como el valor controlado y el lineal, le permiten controlar de forma pormenorizada el proceso de cambio de tráfico del modelo actual al nuevo durante la actualización. También hay protecciones integradas, como las reversiones automáticas, que le ayudan a detectar los problemas a tiempo y a tomar medidas correctivas automáticamente antes de que afecten significativamente a la producción.
Las barreras de protección de implementación proporcionan las siguientes ventajas:
Seguridad de implementación al actualizar los entornos de producción. Una actualización regresiva de un entorno de producción puede provocar tiempos de inactividad no planificados y afectar al negocio, como un aumento de la latencia del modelo y altas tasas de error. Las barreras de protección de implementación ayudan a mitigar esos riesgos al proporcionar las mejores prácticas y barreras de protección operativa integradas.
Implementación totalmente gestionada. SageMaker AI se encarga de configurar y orquestar estas implementaciones y las integra con los mecanismos de actualización de los puntos de conexión. No es necesario crear ni mantener mecanismos de orquestación, monitorización o reversión. Puede utilizar SageMaker AI para configurar y orquestar estas implementaciones y centrarse en aprovechar el machine learning para sus aplicaciones.
Visibilidad. Puede realizar un seguimiento del progreso de la implementación a través de la API DescribeEndpoint o de eventos de Amazon CloudWatch (para los puntos de conexión compatibles). Para obtener más información sobre los eventos en SageMaker AI, consulte la sección sobre el cambio de estado de implementación de los puntos de conexión en Eventos que Amazon SageMaker AI envía a Amazon EventBridge. Tenga en cuenta que si su dispositivo de punto de conexión utiliza alguna de las funciones de la página Exclusiones, no podrá utilizar los eventos de CloudWatch.
nota
Las barreras de protección de implementación solo se aplican a los tipos de puntos de conexión Inferencia asíncrona y Inferencia en tiempo real.
Cómo comenzar
Admitimos dos tipos de implementación para actualizar los modelos en producción: las implementaciones azul/verde y las implementaciones continuas.
-
Implementaciones azul/verde: puede cambiar el tráfico de su flota anterior (flota azul) a una flota nueva (flota verde) con las actualizaciones. Las implementaciones azul/verde ofrecen múltiples modos de cambio de tráfico. Un modo de cambio de tráfico es una configuración que especifica cómo SageMaker AI dirige el tráfico de puntos de conexión a una nueva flota que contiene sus actualizaciones. Los siguientes modos de cambio de tráfico le proporcionan diferentes niveles de control sobre el proceso de actualización de los puntos de conexión:
-
Uso de cambio de tráfico todo a la vez pasa todo el tráfico de puntos de conexión de la flota azul a la flota verde. Una vez que el tráfico pasa a la flota verde, las alarmas de Amazon CloudWatch preespecificadas comienzan a monitorizar la flota verde durante un período de tiempo determinado (período de cocción). Si no se activa ninguna alarma durante el período de cocción, SageMaker AI cancelará la flota azul.
-
Uso de cambio de tráfico de canario pasa una pequeña parte de su tráfico (un valor controlado) a la flota verde y la monitoriza durante un período de cocción. Si el valor controlado tiene éxito en la flota verde, SageMaker AI desplazará el resto del tráfico de la flota azul a la verde antes de dar por finalizada la flota azul.
-
Uso de cambio de tráfico lineal ofrece una personalización aún mayor en cuanto al número de pasos de cambio de tráfico y el porcentaje de tráfico que se debe cambiar en cada paso. Si bien el cambio de sentido vertical le permite desplazar el tráfico en dos pasos, el cambio lineal lo amplía a n pasos espaciados linealmente.
-
-
Uso de implementaciones continuas: puede actualizar su punto de conexión a medida que SageMaker AI aprovisione la capacidad de forma incremental y desplace el tráfico a una nueva flota en pasos del tamaño de lote que especifique. Las instancias de la nueva flota se actualizan con la nueva configuración de implementación y, si no se activa ninguna alarma de CloudWatch durante el período de cocción, SageMaker AI limpia las instancias de la flota anterior. Esta opción le proporciona un control pormenorizado sobre el número de instancias o el porcentaje de capacidad que se modifica en cada paso.
Puede crear y gestionar su despliegue mediante las API de SageMaker UpdateEndpoint y CreateEndpoint, así como los comandos AWS Command Line Interface. Consulte las páginas de implementación individuales para obtener más información sobre cómo configurar su implementación. Tenga en cuenta que si su punto de conexión utiliza alguna de las funciones enumeradas en la página Exclusiones, no podrá utilizar las barreras de protección de implementación.
Para seguir los ejemplos guiados que muestran cómo utilizar las barreras de protección de implementación, consulte nuestros ejemplos de cuadernos de Jupyter