View a markdown version of this page

Ingestion d'alarmes CloudWatch - Guide de l'utilisateur d'AWS pour la détection et la réponse aux incidents

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ingestion d'alarmes CloudWatch

AWS Incident Detection and Response peut intégrer les CloudWatch alarmes Amazon afin de fournir une surveillance proactive de vos charges de travail critiques. En ingérant vos CloudWatch alarmes Amazon à des fins de surveillance, AWS Incident Detection and Response peut :

  • Détecte automatiquement lorsque vos alarmes passent à l'état « Alarme ».

  • Mobilisez vos équipes pour répondre aux incidents et les résoudre de manière collaborative.

Pour garantir l'efficacité des alarmes que vous intégrez, AWS Incident Detection and Response recommande les meilleures pratiques suivantes :

  • Configurez les alarmes à l'aide d'expressions mathématiques métriques pour les supprimer pendant les périodes de maintenance régulière ou d'exécution de tâches par lots afin d'éviter les déclenchements d'alarmes faussement positifs.

  • Définissez le traitement des données manquantes sur les alarmes en fonction de la fréquence de livraison prévue des points de données. Par exemple, les métriques de surveillance des alarmes qui génèrent un flux continu de points de données doivent traiter les données manquantes comme des « violations » (mauvaises), car des points de données manquants peuvent indiquer un problème lié à la ressource sous-jacente surveillée. Inversement, les métriques de surveillance des alarmes qui signalent rarement des points de données, par exemple les métriques de surveillance des alarmes qui n'enregistrent les points de données qu'en cas de défaillance ou d'erreur, doivent considérer les données manquantes comme (bonnes). NotBreaching

  • Définissez des alarmes qui passent à l'état « Alarme » en cas d'impact critique et continu sur votre charge de travail. Par exemple, configurez les alarmes pour qu'elles se déclenchent après le délai prévu pour remplacer automatiquement les ressources défectueuses, plutôt que lors de la détection initiale de ressources défectueuses.

  • Identifiez et créez des alarmes pour des métriques personnalisées qui représentent directement l'expérience client adaptée à votre charge de travail.

Pour obtenir la liste des CloudWatch alarmes Amazon les plus courantes recommandées Services AWS, consultez les meilleures pratiques en matière de détection des incidents et de réponse aux alarmes sur AWS Re:post.