Ingestion d'alarmes CloudWatch

AWS Incident Detection and Response peut intégrer les CloudWatch alarmes Amazon afin de fournir une surveillance proactive de vos charges de travail critiques. En ingérant vos CloudWatch alarmes Amazon à des fins de surveillance, AWS Incident Detection and Response peut :

Détecte automatiquement lorsque vos alarmes passent à l'état « Alarme ».
Mobilisez vos équipes pour répondre aux incidents et les résoudre de manière collaborative.

Pour garantir l'efficacité des alarmes que vous intégrez, AWS Incident Detection and Response recommande les meilleures pratiques suivantes :

Configurez les alarmes à l'aide d'expressions mathématiques métriques pour les supprimer pendant les périodes de maintenance régulière ou d'exécution de tâches par lots afin d'éviter les déclenchements d'alarmes faussement positifs.
Définissez le traitement des données manquantes sur les alarmes en fonction de la fréquence de livraison prévue des points de données. Par exemple, les métriques de surveillance des alarmes qui génèrent un flux continu de points de données doivent traiter les données manquantes comme des « violations » (mauvaises), car des points de données manquants peuvent indiquer un problème lié à la ressource sous-jacente surveillée. Inversement, les métriques de surveillance des alarmes qui signalent rarement des points de données, par exemple les métriques de surveillance des alarmes qui n'enregistrent les points de données qu'en cas de défaillance ou d'erreur, doivent considérer les données manquantes comme (bonnes). NotBreaching
Définissez des alarmes qui passent à l'état « Alarme » en cas d'impact critique et continu sur votre charge de travail. Par exemple, configurez les alarmes pour qu'elles se déclenchent après le délai prévu pour remplacer automatiquement les ressources défectueuses, plutôt que lors de la détection initiale de ressources défectueuses.
Identifiez et créez des alarmes pour des métriques personnalisées qui représentent directement l'expérience client adaptée à votre charge de travail.

Pour obtenir la liste des CloudWatch alarmes Amazon les plus courantes recommandées Services AWS, consultez les meilleures pratiques en matière de détection des incidents et de réponse aux alarmes sur AWS Re:post.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Définition de l'alarme

Ingestion des alarmes APM