Métricas de Amazon MSK para la supervisión de agentes Express con CloudWatch - Transmisión administrada de Amazon para Apache Kafka

Métricas de Amazon MSK para la supervisión de agentes Express con CloudWatch

Amazon MSK se integra con CloudWatch para que pueda recopilar, visualizar y analizar las métricas de CloudWatch de los agentes Express de MSK. Las métricas que se recopilan para los clústeres de MSK aprovisionados se recopilan automáticamente y se envían a CloudWatch en intervalos de 1 minuto. Puede establecer el nivel de supervisión de un clúster de MSK aprovisionado en uno de los siguientes: DEFAULT, PER_BROKER, PER_TOPIC_PER_BROKER o PER_TOPIC_PER_PARTITION. Las tablas de las secciones siguientes muestran las métricas que están disponibles a partir de cada nivel de supervisión.

Las métricas de DEFAULT son gratuitas. Los precios de otras métricas se describen en la página Precios de Amazon CloudWatch.

Nivel de supervisión DEFAULT para agentes Express

Las métricas descritas en la tabla siguiente están disponibles sin costo en el nivel de supervisión DEFAULT.

Nombre Cuando está visible Dimensiones Descripción

ActiveControllerCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster

Sólo debe estar activo en un momento dado un controlador por clúster.

BytesInPerSec

Después de crear un tema.

Nombre del clúster, ID del agente, Tema

El número de bytes por segundo recibidos de los clientes. Esta métrica está disponible por agente y también por tema.

BytesOutPerSec

Después de crear un tema.

Nombre del clúster, ID del agente, Tema

El número de bytes por segundo enviados a los clientes. Esta métrica está disponible por agente y también por tema.

ClientConnectionCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente, autenticación del cliente

El número de conexiones de cliente autenticadas y activas.

ConnectionCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de conexiones activas autenticadas, no autenticadas y entre agentes.

CpuIdle

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El porcentaje de tiempo de inactividad de la CPU.

CpuSystem

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El porcentaje de CPU en el espacio del kernel.

CpuUser

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El porcentaje de CPU en el espacio de usuario.

GlobalPartitionCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster

El número de particiones en todos los temas del clúster, sin incluir las réplicas. Debido a que GlobalPartitionCount no incluye réplicas, la suma de los valores de PartitionCount puede ser mayor que GlobalPartitionCount si el factor de replicación de un tema es superior a 1.

GlobalPartitionCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster

Número total de temas entre todos los agentes del clúster.

EstimatedMaxTimeLag

Después de que el grupo de consumidores consuma de un tema.

Grupo de consumidores, tema

Tiempo estimado (en segundos) para drenar MaxOffsetLag.

LeaderCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número total de líderes de particiones por agente, sin incluir las réplicas.

MaxOffsetLag

Después de que el grupo de consumidores consuma de un tema.

Grupo de consumidores, tema

El retraso máximo de desplazamiento en todas las particiones de un tema.

MemoryBuffered

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El tamaño en bytes de memoria almacenada en búfer para el agente.

MemoryCached

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El tamaño en bytes de memoria almacenada en caché para el agente..

MemoryFree

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El tamaño en bytes de memoria que está libre y disponible para el agente.

MemoryUsed

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El tamaño en bytes de memoria que está en uso para el agente.

MessagesInPerSec

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de mensajes entrantes por segundo para el agente.

NetworkRxDropped

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de paquetes abandonados descartados.

NetworkRxErrors

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de errores de recepción de la red para el agente.

NetworkRxPackets

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de paquetes recibidos por el agente.

NetworkTxDropped

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de paquetes de transmisión descartados.

NetworkTxErrors

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de errores de transmisión de red para el agente.

NetworkTxPackets

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número de paquetes transmitidos por el agente.

PartitionCount

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número total de particiones de temas por agente, lo que incluye las réplicas.

ProduceTotalTimeMsMean

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El tiempo medio de producción en milisegundos.

RequestBytesMean

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

El número medio de bytes de solicitud para el agente.

RequestTime

Después de aplicar la limitación de solicitudes.

Nombre del clúster, ID del agente

El tiempo promedio en milisegundos empleado en la red de agentes y subprocesos de E/S para procesar solicitudes.

Almacenamiento utilizado Después de que el clúster llegue al estado ACTIVE (Activo). Nombre del clúster El almacenamiento total utilizado en todas las particiones del clúster, con exclusión de las réplicas.

SumOffsetLag

Después de que el grupo de consumidores consuma de un tema.

Grupo de consumidores, tema

El retraso de desplazamiento agregado de todas las particiones de un tema.

UserPartitionExists

Después de que el clúster llegue al estado ACTIVE (Activo).

Nombre del clúster, ID del agente

Métrica booleana que indica la presencia de una partición propiedad del usuario en un agente. Un valor de 1 indica la presencia de particiones en el agente.

Nivel de supervisión PER_BROKER para agentes Express

Al establecer el nivel de supervisión en PER_BROKER, obtendrá las métricas descritas en la tabla siguiente además de todas las métricas a nivel de DEFAULT. Paga por las métricas de la tabla siguiente, mientras que las métricas del nivel DEFAULT se mantienen gratuitas. Las métricas de esta tabla tienen las dimensiones siguientes: nombre del clúster, identificador del agente.

Nombre Cuando está visible Descripción

ConnectionCloseRate

Después de que el clúster llegue al estado ACTIVE (Activo).

El número de conexiones cerradas por segundo por oyente. Este número se agrega por oyente y se filtra para los oyentes del cliente.

ConnectionCreationRate

Después de que el clúster llegue al estado ACTIVE (Activo).

El número de conexiones nuevas establecidas por segundo por oyente. Este número se agrega por oyente y se filtra para los oyentes del cliente.

FetchConsumerLocalTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos que la solicitud del consumidor se procesa en el líder.

FetchConsumerRequestQueueTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos que la solicitud del consumidor espera en la cola de solicitudes.

FetchConsumerResponseQueueTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos que la solicitud del consumidor espera en la cola de respuesta.

FetchConsumerResponseSendTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos para que el consumidor envíe una respuesta.

FetchConsumerTotalTimeMsMean

Después de que haya un productor/consumidor.

El tiempo total medio en milisegundos que los consumidores gastan en obtener datos del agente.

FetchFollowerLocalTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos que la solicitud del seguidor se procesa en el líder.

FetchFollowerRequestQueueTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos que la solicitud del seguidor espera en la cola de solicitudes.

FetchFollowerResponseQueueTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos que la solicitud del seguidor espera en la cola de respuesta.

FetchFollowerResponseSendTimeMsMean

Después de que haya un productor/consumidor.

Tiempo medio en milisegundos para que el seguidor envíe una respuesta.

FetchFollowerTotalTimeMsMean

Después de que haya un productor/consumidor.

El tiempo total medio en milisegundos que los seguidores gastan en obtener datos del agente.

FetchThrottleByteRate

Después de aplicar la limitación del ancho de banda.

El número de bytes acelerados por segundo.

FetchThrottleQueueSize

Después de aplicar la limitación del ancho de banda.

El número de mensajes en la cola del acelerador.

FetchThrottleTime

Después de aplicar la limitación del ancho de banda.

El tiempo promedio de aceleración de recuperación en milisegundos.

IAMNumberOfConnectionRequests

Después de que el clúster llegue al estado ACTIVE (Activo).

La cantidad de solicitudes de autenticación de IAM por segundo.

IAMTooManyConnections

Después de que el clúster llegue al estado ACTIVE (Activo).

El número de conexiones intentadas por encima de 100. 0 significa que el número de conexiones se encuentra dentro del límite. Si >0, el límite de limitación controlada se está superando y debe reducir el número de conexiones.

NetworkProcessorAvgIdlePercent

Después de que el clúster llegue al estado ACTIVE (Activo).

Porcentaje medio del tiempo en que los procesadores de red están inactivos.

ProduceLocalTimeMsMean

Después de que el clúster llegue al estado ACTIVE (Activo).

Tiempo medio en milisegundos en el que la solicitud se procesa en el líder.

ProduceRequestQueueTimeMsMean

Después de que el clúster llegue al estado ACTIVE (Activo).

Tiempo medio en milisegundos que los mensajes de solicitud pasan en la cola.

ProduceResponseQueueTimeMsMean

Después de que el clúster llegue al estado ACTIVE (Activo).

Tiempo medio en milisegundos que pasan los mensajes de respuesta en la cola.

ProduceResponseSendTimeMsMean

Después de que el clúster llegue al estado ACTIVE (Activo).

Tiempo medio en milisegundos dedicado al envío de mensajes de respuesta.

ProduceThrottleByteRate

Después de aplicar la limitación del ancho de banda.

El número de bytes acelerados por segundo.

ProduceThrottleQueueSize

Después de aplicar la limitación del ancho de banda.

El número de mensajes en la cola del acelerador.

ProduceThrottleTime

Después de aplicar la limitación del ancho de banda.

El tiempo promedio de producción del acelerador en milisegundos.

ProduceTotalTimeMsMean

Después de que el clúster llegue al estado ACTIVE (Activo).

El tiempo medio de producción en milisegundos.

ReplicationBytesInPerSec

Después de crear un tema.

El número de bytes por segundo recibidos de otros agentes.

ReplicationBytesOutPerSec

Después de crear un tema.

El número de bytes enviados por segundo a otros agentes.

RequestExemptFromThrottleTime

Después de aplicar la limitación de solicitudes.

El tiempo promedio en milisegundos empleado en la red del agente y subprocesos de E/S para procesar solicitudes que están exentas de limitación.

RequestHandlerAvgIdlePercent

Después de que el clúster llegue al estado ACTIVE (Activo).

El porcentaje medio del tiempo en que los subprocesos del controlador de solicitudes están inactivos.

RequestThrottleQueueSize

Después de aplicar la limitación de solicitudes.

El número de mensajes en la cola del acelerador.

RequestThrottleTime

Después de aplicar la limitación de solicitudes.

El tiempo medio de aceleración de la solicitud en milisegundos.

TcpConnections

Después de que el clúster llegue al estado ACTIVE (Activo).

Muestra el número de segmentos TCP entrantes y salientes con el indicador SYN establecido.

TrafficBytes

Después de que el clúster llegue al estado ACTIVE (Activo).

Muestra el tráfico de red en bytes totales entre clientes (productores y consumidores) y agentes. No se informa del tráfico entre agentes.

Nivel de supervisión PER_TOPIC_PER_PARTITION para agentes Express

Cuando establece el nivel de supervisión en PER_TOPIC_PER_PARTITION, obtiene las métricas descritas en la tabla siguiente, además de todas las métricas de los niveles PER_TOPIC_PER_BROKER, PER_BROKER y DEFAULT. Solo las métricas del nivel DEFAULT son gratuitas. Las métricas de esta tabla tienen las siguientes dimensiones: grupo de consumidores, tema y partición.

Nombre Cuando está visible Descripción

EstimatedTimeLag

Después de que el grupo de consumidores consuma de un tema.

Tiempo estimado (en segundos) para reducir el retraso de desplazamiento de la partición.

OffsetLag

Después de que el grupo de consumidores consuma de un tema.

El desfase del consumidor de la partición en cuanto al número de compensaciones.

Nivel de supervisión PER_TOPIC_PER_BROKER para agentes Express

Cuando establece el nivel de supervisión en PER_TOPIC_PER_BROKER, obtiene las métricas descritas en la tabla siguiente, además de todas las métricas de los niveles PER_BROKER y DEFAULT. Solo las métricas del nivel DEFAULT son gratuitas. Las métricas de esta tabla tienen las dimensiones siguientes: nombre del clúster, identificador del agente, tema.

importante

Las métricas de la tabla siguiente aparecen únicamente después de que sus valores pasan a ser distintos de cero por primera vez. Por ejemplo, para ver BytesInPerSec, uno o más productores deben enviar datos previamente al clúster.

Nombre Cuando está visible Descripción

MessagesInPerSec

Después de crear un tema.

El número de mensajes recibidos por segundo.