Métricas de CloudWatch disponibles para Amazon SQS
Amazon SQS envía las siguientes métricas a CloudWatch.
nota
En el caso de algunas métricas, el resultado es aproximado debido a la arquitectura distribuida de Amazon SQS. En la mayoría de los casos, el recuento debe aproximarse al número real de mensajes de la cola.
Métricas de Amazon SQS
Amazon SQS publica automáticamente métricas operativas en Amazon CloudWatch bajo el espacio de nombres AWS/SQS. Estas métricas le ayudan a supervisar el estado y rendimiento de la cola. Debido a la naturaleza distribuida de SQS, muchos valores son aproximados, pero lo suficientemente precisos para la mayoría de las decisiones operativas.
nota
-
Todas las métricas emiten valores no negativos solo cuando la cola está activa.
-
Algunas métricas (como
SentMessageSize) no se emiten hasta que se envía al menos un mensaje.
| Métrica | Descripción | Unidades | Notificación de comportamiento | Notas clave |
|---|---|---|---|---|
ApproximateAgeOfOldestMessage |
La antigüedad del mensaje sin procesar más antiguo de la cola. | Segundos |
Se notifica si la cola contiene al menos un mensaje activo. |
|
ApproximateNumberOfGroupsWithInflightMessages |
Solo para FIFO. El número de grupos de mensajes con uno o más mensajes en tránsito. | Recuento |
Se notifica si la cola FIFO está activa. |
|
ApproximateNumberOfMessagesDelayed |
El número de mensajes de la cola que van con retraso y no están inmediatamente disponibles para su recuperación. |
Recuento |
Se notifica si hay mensajes retrasados en la cola. |
|
ApproximateNumberOfMessagesNotVisible |
El número de mensajes en tránsito que se han recibido pero que aún no se han eliminado ni han caducado. | Recuento |
Se notifica si existen mensajes en tránsito. |
|
ApproximateNumberOfMessagesVisible |
El número de mensajes actualmente disponibles para su recuperación y procesamiento. | Recuento |
Se notifica si la cola está activa. |
|
NumberOfEmptyReceives¹ |
El número de llamadas a la API ReceiveMessage que no devolvieron ningún mensaje. | Recuento |
Se notifica durante las operaciones de recepción. |
|
NumberOfDeduplicatedSentMessages |
Solo para FIFO. El número de mensajes enviados que se desduplicaron y no se agregaron a la cola. | Recuento |
Se notifica si se detectan valores o contenidos duplicados en MessageDeduplicationId. |
|
NumberOfMessagesDeleted¹ |
El número de mensajes eliminados correctamente de la cola. |
Recuento |
Se notifica para cada solicitud de eliminación con un identificador de recepción válido. |
|
NumberOfMessagesReceived¹ |
El número de mensajes devueltos por la API ReceiveMessage. | Recuento |
Se notifica durante las operaciones de recepción. |
|
NumberOfMessagesSent¹ |
El número de mensajes agregados correctamente a una cola. | Recuento |
Se notifica por cada envío manual realizado correctamente. |
|
SentMessageSize¹ |
El tamaño de los mensajes enviados correctamente a la cola. |
Bytes |
No se emite hasta que se envíe al menos un mensaje. |
|
ApproximateNumberOfNoisyGroups |
El número de grupos de mensajes que se consideran ruidosos en una cola justa. Un grupo de mensajes ruidoso representa un inquilino vecino ruidoso de una cola de varios inquilinos. |
Recuento |
Se notifica un valor no negativo si la cola está activa. |
|
ApproximateNumberOfMessagesVisibleInQuietGroups |
El número de mensajes visibles, sin incluir los mensajes de grupos de mensajes ruidosos. |
Recuento |
Se notifica un valor no negativo si la cola está activa. |
|
ApproximateNumberOfMessagesNotVisibleInQuietGroups |
El número de mensajes en tránsito, sin incluir los mensajes de grupos de mensajes ruidosos. | Recuento |
Se notifica un valor no negativo si la cola está activa. |
|
ApproximateNumberOfMessagesDelayedInQuietGroups |
El número de mensajes, sin incluir los mensajes de grupos de mensajes ruidosos que van con retraso y no están disponibles para su lectura inmediata. Los mensajes retrasados se producen cuando la cola está configurada como una cola con retraso o cuando se ha enviado un mensaje con un parámetro de retraso. | Recuento |
Se notifica un valor no negativo si la cola está activa. |
|
ApproximateAgeOfOldestMessageInQuietGroups |
La antigüedad del mensaje más antiguo no eliminado de la cola, sin incluir los mensajes de grupos de mensajes ruidosos. | Segundos |
Se notifica un valor no negativo si la cola está activa. |
|
¹ Estas métricas reflejan la actividad del sistema y pueden incluir reintentos, duplicados o mensajes retrasados. No utilice recuentos sin procesar para estimar el estado de la colas en tiempo real sin tener en cuenta el comportamiento del ciclo de vida de los mensajes.
Colas de mensajes fallidos (DLQ) y métricas de CloudWatch
Al trabajar con DLQ, es importante entender cómo se comportan las métricas de Amazon SQS:
-
NumberOfMessagesSent– Esta métrica se comporta de forma diferente en las DLQ:-
Envío manual: esta métrica captura los mensajes que se envían manualmente a una DLQ.
-
Redireccionamiento automático: esta métrica no captura los mensajes que se trasladan automáticamente a una DLQ debido a errores de procesamiento. Como resultado, las métricas
NumberOfMessagesReceivedyNumberOfMessagesSentpueden mostrar discrepancias en las DLQ.
-
-
Métrica recomendada para las DLQ – Para supervisar el estado de una DLQ, use la métrica
ApproximateNumberOfMessagesVisible. Esta métrica indica el número de mensajes disponibles actualmente para su procesamiento en la DLQ.
Colas justas y métricas de CloudWatch
Cuando se utilizan colas justas, Amazon SQS emite las siguientes métricas adicionales:
-
ApproximateNumberOfNoisyGroups -
ApproximateNumberOfMessagesVisibleInQuietGroups -
ApproximateNumberOfMessagesNotVisibleInQuietGroups -
ApproximateNumberOfMessagesDelayedInQuietGroups -
ApproximateAgeOfOldestMessageInQuietGroups
nota
Cada métrica QuietGroup es un subconjunto de la métrica Approximate estándar equivalente de la cola, pero excluye los mensajes de grupos de vecinos ruidosos.
- Grupos ruidosos
-
Un grupo de mensajes ruidoso representa un inquilino vecino ruidoso de una cola de varios inquilinos.
- Grupos silenciosos
-
Grupos de mensajes que excluyen los grupos ruidosos.
Observación del comportamiento de las colas justas de SQS
Para supervisar el efecto de las colas justas de Amazon SQS, puede comparar las métricas Approximate..InQuietGroups con las métricas estándar de las colas. Durante los picos de tráfico de un inquilino específico, las métricas generales de las cola pueden revelar un aumento de las tareas pendientes o una antigüedad de los mensajes. Sin embargo, al observar los grupos silenciosos de forma aislada, se puede identificar que la mayoría de los grupos de mensajes o inquilinos no ruidosos no se ven afectados y proporcionar una estimación del número total de grupos de mensajes afectados.
Si bien estas nuevas métricas ofrecen una descripción general óptima del comportamiento de las colas justas de Amazon SQS, puede resultar útil saber qué inquilino específico está provocando la carga. La Información de colaboradores de Amazon CloudWatch le permite ver métricas acerca de los colaboradores Top-N, el número total de colaboradores únicos y su uso. Esto resulta especialmente útil en escenarios en los que se trata con miles de inquilinos que, de otro modo, generarían datos (y costos) de alta cardinalidad al emitir métricas tradicionales.
Puede consultar un ejemplo de configuración de supervisión de colas justas en GitHub
Dimensiones para las métricas de Amazon SQS
Las métricas de Amazon SQS en CloudWatch utilizan una sola dimensión: QueueName. Todos los datos de las métricas se agrupan y filtran por el nombre de la cola.
Consejos para la supervisión
Supervise SQS de forma eficaz mediante métricas clave y alarmas de CloudWatch para detectar las colas de tareas pendientes, optimizar el rendimiento y mantenerse dentro de los límites del servicio.
-
Configure alarmas de CloudWatch basadas en
ApproximateNumberOfMessagesVisiblepara detectar el aumento de tareas pendientes. -
Supervise
NumberOfEmptyReceivespara ajustar la frecuencia de los sondeos y reducir el costo de la API. -
Utilice
ApproximateNumberOfGroupsWithInflightMessagesen las colas FIFO para diagnosticar los límites de rendimiento. -
Revise las cuotas de SQS para conocer los umbrales de métricas y los límites del servicio.