View a markdown version of this page

Testen von Alarmen (Gameday) - AWS-Benutzerhandbuch zur Erkennung und Reaktion auf Vorfälle

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Testen von Alarmen (Gameday)

Der letzte Schritt im Onboarding-Prozess für AWS Incident Detection and Response besteht darin, einen Gameday für Ihren neuen Workload durchzuführen. Nach den Schritten zur Alarmaufnahme bestätigt AWS Incident Detection and Response ein Datum und eine Uhrzeit Ihrer Wahl, um Ihren Gameday zu beginnen.

Ihr Gameday dient zwei Hauptzwecken:

  • Funktionsvalidierung: Bestätigt, dass AWS Incident Detection and Response Ihre Alarmereignisse korrekt empfangen kann. Und die Funktionsvalidierung bestätigt, dass Ihre Alarmereignisse die gewünschten Aktionen auslösen, z. B. die automatische Erstellung von Support-Anfragen, falls Sie dies bei der Alarmerfassung ausgewählt haben.

  • Simulation: Der Gameday ist eine umfassende Simulation dessen, was während eines realen Vorfalls passieren könnte. AWS Incident Detection and Response gibt Ihnen einen Einblick, wie sich ein realer Vorfall entwickeln könnte. Der Gameday bietet Ihnen die Gelegenheit, Fragen zu stellen oder Anweisungen zu verfeinern, um das Engagement zu verbessern.

Während des Alarmtests arbeitet AWS Incident Detection and Response mit Ihnen zusammen, um alle festgestellten Probleme zu beheben.

CloudWatch Testen von Alarmen

Während des Gamedays werden CloudWatch Amazon-Alarme getestet, indem der Alarm mithilfe von manuell in den Alarmstatus versetzt wird. AWS Command Line Interface Sie können auch auf das AWS CLI Formular zugreifen. AWS CloudShell AWS Incident Detection and Response stellt Ihnen eine Liste von AWS CLI Befehlen zur Verfügung, die Sie beim Testen verwenden können.

AWS CLI Beispielbefehl zum Einstellen eines Alarmstatus:

aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --region us-east-1
Anmerkung

Der AWS Identity and Access Management Benutzer oder die Rolle, die Sie für den Alarmtest verwenden, muss über eine cloudwatch:SetAlarmState entsprechende Berechtigung verfügen.

Weitere Informationen zum manuellen Ändern des Status von CloudWatch Alarmen finden Sie unter SetAlarmState.

Weitere Informationen zu den für CloudWatch API-Operationen erforderlichen Berechtigungen finden Sie in der CloudWatch Amazon-Berechtigungsreferenz.

Testen von APM-Alarmen durch Dritte

Workloads, die ein APM-Tool (Application Performance Monitoring) eines Drittanbieters wie Datadog, Splunk, New Relic oder Dynatrace verwenden, benötigen unterschiedliche Anweisungen, um einen Alarm zu simulieren. Zu Beginn des Spieltages fordert AWS Incident Detection and Response Sie auf, vorübergehend Ihre Alarmschwellenwerte oder Vergleichsoperatoren zu ändern, um den Alarm in den ALARM-Status zu versetzen. Dieser Status löst eine Payload für AWS Incident Detection and Response aus.

Der Gameday bestätigt die folgenden Punkte

  • Die Alarmeinspeisung war erfolgreich und Ihre Alarmkonfiguration ist korrekt.

  • Alarme werden erfolgreich von AWS Incident Detection and Response erstellt und empfangen.

  • Für Ihren Vorfall wird ein Support-Fall erstellt und Ihre vorgeschriebenen Runbook-Ansprechpartner werden benachrichtigt.

  • AWS Incident Detection and Response kann mit Ihnen über Ihre definierte Konferenzbrückenmethode in Kontakt treten.