Alarmas y registros para realizar un seguimiento de las métricas de los puntos de conexión sin servidor
Para supervisar su punto de conexión sin servidor, puede utilizar las alarmas de Amazon CloudWatch. CloudWatch es un servicio que recopila métricas en tiempo real de sus aplicaciones AWS y recursos. Una alarma vigila las métricas a medida que se recopilan y permite especificar previamente un umbral y las medidas que deberían tomarse en caso de que se supere. Por ejemplo, la alarma de CloudWatch puede enviarle una notificación en caso de que su punto de conexión supere un umbral de error. Al configurar las alarmas de CloudWatch, obtendrá visibilidad del rendimiento y la funcionalidad de su punto de conexión. Para obtener más información acerca de la creación de alarmas de CloudWatch, consulte Uso de las alarmas de Amazon CloudWatch en la Guía del usuario de Amazon CloudWatch.
Monitorización con CloudWatch
Las siguientes métricas son una lista exhaustiva de métricas para puntos de conexión sin servidor. Las métricas que no figuran a continuación no se publican para los puntos de conexión sin servidor. Para obtener información sobre las siguientes métricas, consulte Monitor Amazon SageMaker AI with Amazon CloudWatch.
Métricas de puntos de conexión comunes
Estas métricas de CloudWatch son las mismas que las publicadas para los puntos de conexión en tiempo real.
La métrica OverheadLatency registra toda la latencia adicional que SageMaker AI ha añadido, incluida la hora de arranque en frío para lanzar nuevos recursos de computación para el punto de conexión sin servidor. En comparación con los puntos de conexión sin servidor bajo demanda, la OverheadLatency de los puntos de conexión sin servidor con la simultaneidad aprovisionada suele ser significativamente menor.
Los puntos de conexión sin servidor también pueden utilizar las métricas Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime y MemoryUtilization. Para obtener más información sobre estas métricas, consulte Métricas de invocación de punto de conexión de SageMaker AI.
Métricas de punto de conexión sin servidor
Estas métricas de CloudWatch se publican tanto para los puntos de conexión sin servidor bajo demanda como para los puntos de conexión sin servidor con simultaneidad aprovisionada.
| Nombre de métrica | Descripción | Unidad/estadísticas |
|---|---|---|
ServerlessConcurrentExecutionsUtilization |
El número de ejecuciones simultáneas entre la simultaneidad máxima. | Unidades: ninguna Estadísticas válidas: media, máxima, mínima |
Punto de conexión sin servidor con métricas de simultaneidad aprovisionada
Estas métricas de CloudWatch se publican para puntos de conexión sin servidor con simultaneidad aprovisionada.
| Nombre de métrica | Descripción | Unidad/estadísticas |
|---|---|---|
ServerlessProvisionedConcurrencyExecutions |
El número de ejecuciones simultáneas que gestiona el punto de conexión. | Unidades: recuento Estadísticas válidas: media, máxima, mínima |
ServerlessProvisionedConcurrencyUtilization |
El número de ejecuciones simultáneas por la simultaneidad aprovisionada asignada. | Unidades: ninguna Estadísticas válidas: media, máxima, mínima |
ServerlessProvisionedConcurrencyInvocations |
El número de solicitudes InvokeEndpoint gestionadas por la simultaneidad aprovisionada. |
Unidades: recuento Estadísticas válidas: media, máxima, mínima |
ServerlessProvisionedConcurrencySpilloverInvocations |
El número de solicitudes de InvokeEndpoint no administradas por la simultaneidad aprovisionada, sino administradas por la inferencia sin servidor bajo demanda. |
Unidades: recuento Estadísticas válidas: media, máxima, mínima |
Registros
Si desea monitorizar los registros de su punto de conexión para realizar una depuración o un análisis del progreso, puede utilizar registros de Amazon CloudWatch. El grupo de registros proporcionado por SageMaker AI que puede usar para los puntos de conexión sin servidor es /aws/sagemaker/Endpoints/[EndpointName]. Para obtener más información sobre el uso de registros de CloudWatch en SageMaker AI, consulte CloudWatch Logs para Amazon SageMaker AI. Para obtener más información sobre los registros de CloudWatch, consulte ¿Qué son los registros de CloudWatch de Amazon? en la Guía del usuario de registros de CloudWatch de Amazon.