Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Test des alarmes (Gameday)
La dernière étape du processus d'intégration d'AWS Incident Detection and Response consiste à organiser un Gameday pour votre nouvelle charge de travail. Après les étapes d'ingestion des alarmes, AWS Incident Detection and Response confirme la date et l'heure que vous avez choisies pour commencer votre journée de jeu.
Votre Gameday a deux objectifs principaux :
Validation fonctionnelle : confirme qu'AWS Incident Detection and Response peut correctement recevoir vos événements d'alarme. De plus, la validation fonctionnelle confirme que vos événements d'alarme déclenchent les actions souhaitées, telles que la création automatique d'un dossier d'assistance si vous l'avez sélectionnée lors de l'ingestion de l'alarme.
Simulation : Le Gameday est une simulation de bout en bout de ce qui pourrait se passer lors d'un incident réel. AWS Incident Detection and Response vous donne un aperçu de la façon dont un véritable incident peut se dérouler. Le Gameday est l'occasion pour vous de poser des questions ou d'affiner les instructions afin d'améliorer l'engagement.
Pendant le test d'alarme, AWS Incident Detection and Response travaille avec vous pour résoudre les problèmes identifiés.
CloudWatch Test d'alarme
Pendant le Gameday, les CloudWatch alarmes Amazon sont testées en les faisant passer manuellement à l'état Alarme à l'aide du AWS Command Line Interface. Vous pouvez également accéder au AWS CLI formulaire AWS CloudShell. AWS Incident Detection and Response fournit une liste de AWS CLI commandes que vous pouvez utiliser pendant les tests.
Exemple de AWS CLI commande pour définir un état d'alarme :
aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --regionus-east-1
Note
L' Gestion des identités et des accès AWS utilisateur ou le rôle que vous utilisez pour tester les alarmes doit disposer d'une cloudwatch:SetAlarmState autorisation.
Pour en savoir plus sur la modification manuelle de l'état des CloudWatch alarmes, consultez SetAlarmState.
Pour en savoir plus sur les autorisations requises pour les opérations CloudWatch d'API, consultez la référence CloudWatch des autorisations Amazon.
Test d'alarmes APM par un tiers
Les charges de travail qui utilisent un outil tiers de surveillance des performances des applications (APM), tel que Datadog, Splunk, New Relic ou Dynatrace, nécessitent des instructions différentes pour simuler une alarme. Au début du Gameday, AWS Incident Detection and Response vous demande de modifier temporairement vos seuils d'alarme ou vos opérateurs de comparaison pour forcer l'alarme à passer au statut ALARM. Ce statut déclenche une charge utile pour AWS Incident Detection and Response.
Le Gameday valide les points suivants
L'ingestion de l'alarme est réussie et la configuration de votre alarme est correcte.
Les alarmes sont créées et reçues avec succès par AWS Incident Detection and Response.
Un dossier d'assistance est créé pour votre incident et les contacts que vous avez prescrits pour le runbook sont avertis.
AWS Incident Detection and Response peut interagir avec vous selon la méthode de pont de conférence que vous avez définie.