Combinaison d'alarmes - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Combinaison d'alarmes

Vous pouvez ainsi combiner plusieurs alarmes en une seule alarme composite afin de créer un indicateur de santé résumé et agrégé pour l'ensemble d'une application ou d'un groupe de ressources. CloudWatch Les alarmes composites sont des alarmes qui déterminent leur état en surveillant les états des autres alarmes. Vous définissez des règles pour combiner l'état de ces alarmes surveillées en utilisant la logique booléenne.

Vous pouvez utiliser des alarmes composites pour réduire le bruit d'alarme en prenant des mesures uniquement à un niveau agrégé. Par exemple, vous pouvez créer une alarme composite pour envoyer une notification à l'équipe de votre serveur Web si une alarme liée à votre serveur Web se déclenche. Lorsque l'une de ces alarmes passe à l'état ALARM, l'alarme composite passe elle-même à l'état ALARM et envoie une notification à votre équipe. Si d'autres alarmes liées à votre serveur Web passent également à l'état ALARM, votre équipe ne sera pas surchargée de nouvelles notifications puisque l'alarme composite l'a déjà informée de la situation existante.

Vous pouvez également utiliser des alarmes composites pour créer des conditions d'alarme complexes et prendre des mesures uniquement lorsque de nombreuses conditions différentes sont remplies. Par exemple, vous pouvez créer une alarme composite qui combine une alarme de processeur et une alarme de mémoire, et qui n'avertirait votre équipe que si les alarmes du processeur et de la mémoire se sont déclenchées.

Utilisation d'alarmes composites

Lorsque vous utilisez des alarmes composites, deux options s'offrent à vous :

  • configurer les actions que vous souhaitez effectuer uniquement au niveau des alarmes composites et créer les alarmes surveillées sous-jacentes sans actions ;

  • configurer un ensemble d'actions différent au niveau de l'alarme composite. Par exemple, les actions d'alarme composites pourraient impliquer une autre équipe en cas de problème généralisé.

Les alarmes composites ne peuvent effectuer que les actions suivantes :

  • Notifier une rubrique Amazon SNS

  • Invoquer des fonctions Lambda

  • Création OpsItems dans le Systems Manager Ops Center

  • Création d'incidents dans Systems Manager Incident Manager

Note

Toutes les alarmes sous-jacentes de votre alarme composite doivent être dans le même compte et la même région que votre alarme composite. Toutefois, si vous configurez une alarme composite dans un CloudWatch compte de surveillance de l'observabilité entre comptes, les alarmes sous-jacentes peuvent surveiller les métriques dans différents comptes sources et dans le compte de surveillance lui-même. Pour de plus amples informations, veuillez consulter CloudWatch observabilité entre comptes.

Une alerte composite unique peut surveiller 100 alertes sous-jacentes, et 150 alertes composites peuvent surveiller une seule alerte sous-jacente.

Expressions de règle

Toutes les alertes composites contiennent des expressions normées. Les expressions normées indiquent aux alertes composites les autres alertes à surveiller et à partir desquelles elles doivent déterminer leur état. Une expression normée peut faire référence à la fois aux alertes de métrique et à d'autres alertes composites. Lorsque vous référencez une alerte dans une expression normée, vous désignez une fonction de l'alerte qui détermine dans quel état l'alerte se trouvera parmi les trois états suivants :

  • ALARM

    ALARM ("alarm-name or alarm-ARN") est défini sur TRUE si l'alarme est à l'état ALARM.

  • OK

    OK ("alarm-name or alarm-ARN") est défini sur TRUE si l'alarme est à l'état OK.

  • INSUFFICIENT_DATA

    INSUFFICIENT_DATA (“alarm-name or alarm-ARN") est défini sur TRUE si l'alarme nommée est à l'état INSUFFICIENT_DATA.

Note

TRUE a toujours pour valeur TRUE, et FALSE a toujours pour valeur FALSE.

Références d'alarme

Lorsque vous référencez une alarme, en utilisant le nom ou l'ARN de l'alarme, la syntaxe de la règle permet de référencer l'alarme avec ou sans guillemets («) autour du nom ou de l'ARN de l'alarme.

  • S'ils sont spécifiés sans guillemets, les noms des alarmes ne ARNs doivent pas contenir d'espaces, de crochets ou de virgules.

  • S'ils sont spécifiés entre guillemets, les noms des alarmes ou ARNs s'ils incluent des guillemets doubles («) doivent être placés entre guillemets («) » en utilisant des barres obliques inverses (\) pour une interprétation correcte de la référence.

Syntaxe

La syntaxe de l'expression que vous utilisez pour combiner plusieurs alarmes en une seule alarme composite utilise la logique et les fonctions booléennes. Le tableau suivant décrit les opérateurs et les fonctions disponibles dans les expressions de règles :

Opérateur/Fonction Description
AND Opérateur logique ET. Renvoie TRUE lorsque toutes les conditions spécifiées sont vraies.
OR Opérateur OR logique. Renvoie TRUE lorsqu'au moins l'une des conditions spécifiées est VRAIE.
NOT Opérateur logique NOT. Renvoie TRUE lorsque la condition spécifiée est FALSE.
AT_LEAST Fonction qui renvoie TRUE lorsqu'un nombre ou un pourcentage minimum d'alarmes spécifiées sont dans l'état requis. Format : AT_LEAST(M, STATE_CONDITION, (alarm1, alarm2, ...alarmN)) où M peut être un nombre absolu ou un pourcentage (par exemple, 50 %), et STATE_CONDITION peut être ALARM, OK, INSUFFIENT_DATA, NOT ALARM, NOT OK ou NOT INSUFFIENT_DATA.

Vous pouvez utiliser des parenthèses pour regrouper les conditions et contrôler l'ordre d'évaluation dans les expressions complexes.

Exemples d'expressions

Le paramètre de requête AlarmRule prend en charge l'utilisation des opérateurs logiques ANDOR, etNOT, ainsi que de la AT_LEAST fonction, afin que vous puissiez combiner plusieurs fonctions en une seule expression. Les exemples d'expressions suivants montrent comment configurer les alertes sous-jacentes dans votre alerte composite :

  • ALARM(CPUUtilizationTooHigh) AND ALARM(DiskReadOpsTooHigh)

    L'expression indique que l'alerte composite passe à l’état ALARM uniquement si CPUUtilizationTooHigh etDiskReadOpsTooHigh sont à l’état ALARM.

  • AT_LEAST(2, ALARM, (WebServer1CPU, WebServer2CPU, WebServer3CPU, WebServer4CPU))

    L'expression indique que l'alarme composite se déclenche ALARM lorsqu'au moins 2 des 4 alarmes du processeur du serveur Web sont ALARM activées. Cela vous permet de déclencher des alertes en fonction d'un seuil de ressources affectées plutôt que de demander à toutes ou à une seule d'entre elles d'être en état d'alarme.

  • AT_LEAST(50%, OK, (DatabaseConnection1, DatabaseConnection2, DatabaseConnection3, DatabaseConnection4))

    L'expression indique que l'alarme composite se déclenche ALARM lorsqu'au moins 50 % des alarmes de connexion à la base de données sont OK activées. L'utilisation de pourcentages permet à la règle de s'adapter dynamiquement lorsque vous ajoutez ou supprimez des alarmes surveillées.

  • ALARM(CPUUtilizationTooHigh) AND NOT ALARM(DeploymentInProgress)

    L'expression indique que l'alerte composite passe à l’état ALARM si CPUUtilizationTooHigh est à l’état ALARM et si DeploymentInProgress n'est pas à l’état ALARM. Il s'agit d'un exemple d'alerte composite qui réduit le bruit d'alerte pendant une fenêtre de déploiement.

  • AT_LEAST(2, ALARM, (AZ1Health, AZ2Health, AZ3Health)) AND NOT ALARM(MaintenanceWindow)

    L'expression indique que l'alarme composite se déclenche ALARM lorsqu'au moins 2 alarmes de santé de zone de disponibilité sur 3 sont activées et que ALARM l'alarme de la fenêtre de maintenance n'est pas activéeALARM. Cela combine la fonction AT_LEAST avec d'autres opérateurs logiques pour des scénarios de surveillance plus complexes.