Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erfassung von Alarmen CloudWatch
AWS Incident Detection and Response kann CloudWatch Amazon-Alarme aufnehmen, um eine proaktive Überwachung Ihrer kritischen Workloads zu ermöglichen. Durch die Erfassung Ihrer CloudWatch Amazon-Alarme zur Überwachung kann AWS Incident Detection and Response:
Erkennt automatisch, wenn Ihre Alarme in den Status „Alarm“ übergehen.
Binden Sie Ihre Teams ein, gemeinsam auf Vorfälle zu reagieren und diese zu lösen.
Um sicherzustellen, dass die von Ihnen eingebundenen Alarme wirksam sind, empfiehlt AWS Incident Detection and Response die folgenden bewährten Methoden:
Konfigurieren Sie Alarme mit metrischen mathematischen Ausdrücken, um sie während regelmäßiger Wartungs- oder Batch-Job-Ausführungen zu unterdrücken und Fehlalarme zu vermeiden.
Legen Sie die Behandlung fehlender Daten für Alarme auf der Grundlage der erwarteten Häufigkeit der Datenpunktzustellung fest. Beispielsweise sollten Alarme, die Metriken überwachen, die einen kontinuierlichen Strom von Datenpunkten generieren, fehlende Daten als „Sicherheitsverletzung“ (schlecht) behandeln, da fehlende Datenpunkte auf ein Problem mit der zu Grunde liegenden überwachten Ressource hinweisen könnten. Umgekehrt sollten Metriken zur Alarm-Überwachung, die selten Datenpunkte melden, wie z. B. Alarm-Überwachungsmetriken, die Datenpunkte nur dann aufzeichnen, wenn ein Fehler oder ein Fehler auftritt, fehlende Daten als (gut) behandeln. NotBreaching
Definieren Sie Alarme, die in den Status „Alarm“ übergehen, wenn es kritische, anhaltende Auswirkungen auf Ihre Arbeitslast gibt. Konfigurieren Sie beispielsweise Alarme so, dass sie erst nach der erwarteten Zeit ausgelöst werden, die für den automatischen Austausch fehlerhafter Ressourcen erforderlich ist, und nicht erst bei der ersten Erkennung fehlerhafter Ressourcen.
Identifizieren und erstellen Sie Alarme für benutzerdefinierte Kennzahlen, die direkt das Kundenerlebnis für Ihren Workload widerspiegeln.
Eine Liste der empfohlenen CloudWatch Amazon-Alarme für häufig verwendete AWS-Services Alarme finden Sie in den Best Practices für Incident Detection and Response Alarm auf AWS re:POST