Alarmas y registros para realizar un seguimiento de las métricas de los puntos de conexión sin servidor - Amazon SageMaker AI

Alarmas y registros para realizar un seguimiento de las métricas de los puntos de conexión sin servidor

Para supervisar su punto de conexión sin servidor, puede utilizar las alarmas de Amazon CloudWatch. CloudWatch es un servicio que recopila métricas en tiempo real de sus aplicaciones AWS y recursos. Una alarma vigila las métricas a medida que se recopilan y permite especificar previamente un umbral y las medidas que deberían tomarse en caso de que se supere. Por ejemplo, la alarma de CloudWatch puede enviarle una notificación en caso de que su punto de conexión supere un umbral de error. Al configurar las alarmas de CloudWatch, obtendrá visibilidad del rendimiento y la funcionalidad de su punto de conexión. Para obtener más información acerca de la creación de alarmas de CloudWatch, consulte Uso de las alarmas de Amazon CloudWatch en la Guía del usuario de Amazon CloudWatch.

Monitorización con CloudWatch

Las siguientes métricas son una lista exhaustiva de métricas para puntos de conexión sin servidor. Las métricas que no figuran a continuación no se publican para los puntos de conexión sin servidor. Para obtener información sobre las siguientes métricas, consulte Monitor Amazon SageMaker AI with Amazon CloudWatch.

Métricas de puntos de conexión comunes

Estas métricas de CloudWatch son las mismas que las publicadas para los puntos de conexión en tiempo real.

La métrica OverheadLatency registra toda la latencia adicional que SageMaker AI ha añadido, incluida la hora de arranque en frío para lanzar nuevos recursos de computación para el punto de conexión sin servidor. En comparación con los puntos de conexión sin servidor bajo demanda, la OverheadLatency de los puntos de conexión sin servidor con la simultaneidad aprovisionada suele ser significativamente menor.

Los puntos de conexión sin servidor también pueden utilizar las métricas Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime y MemoryUtilization. Para obtener más información sobre estas métricas, consulte Métricas de invocación de punto de conexión de SageMaker AI.

Métricas de punto de conexión sin servidor

Estas métricas de CloudWatch se publican tanto para los puntos de conexión sin servidor bajo demanda como para los puntos de conexión sin servidor con simultaneidad aprovisionada.

Nombre de métrica Descripción Unidad/estadísticas
ServerlessConcurrentExecutionsUtilization El número de ejecuciones simultáneas entre la simultaneidad máxima.

Unidades: ninguna

Estadísticas válidas: media, máxima, mínima

Punto de conexión sin servidor con métricas de simultaneidad aprovisionada

Estas métricas de CloudWatch se publican para puntos de conexión sin servidor con simultaneidad aprovisionada.

Nombre de métrica Descripción Unidad/estadísticas
ServerlessProvisionedConcurrencyExecutions El número de ejecuciones simultáneas que gestiona el punto de conexión.

Unidades: recuento

Estadísticas válidas: media, máxima, mínima

ServerlessProvisionedConcurrencyUtilization El número de ejecuciones simultáneas por la simultaneidad aprovisionada asignada.

Unidades: ninguna

Estadísticas válidas: media, máxima, mínima

ServerlessProvisionedConcurrencyInvocations El número de solicitudes InvokeEndpoint gestionadas por la simultaneidad aprovisionada.

Unidades: recuento

Estadísticas válidas: media, máxima, mínima

ServerlessProvisionedConcurrencySpilloverInvocations El número de solicitudes de InvokeEndpoint no administradas por la simultaneidad aprovisionada, sino administradas por la inferencia sin servidor bajo demanda.

Unidades: recuento

Estadísticas válidas: media, máxima, mínima

Registros

Si desea monitorizar los registros de su punto de conexión para realizar una depuración o un análisis del progreso, puede utilizar registros de Amazon CloudWatch. El grupo de registros proporcionado por SageMaker AI que puede usar para los puntos de conexión sin servidor es /aws/sagemaker/Endpoints/[EndpointName]. Para obtener más información sobre el uso de registros de CloudWatch en SageMaker AI, consulte CloudWatch Logs para Amazon SageMaker AI. Para obtener más información sobre los registros de CloudWatch, consulte ¿Qué son los registros de CloudWatch de Amazon? en la Guía del usuario de registros de CloudWatch de Amazon.