Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Auswertung von Alarmen
Metrikalarm-Status
Ein Metrikalarm kann die folgenden Status aufweisen:
-
OK– Die Metrik oder der Ausdruck liegt innerhalb des festgelegten Schwellenwerts. -
ALARM– Die Metrik oder der Ausdruck liegt außerhalb des festgelegten Schwellenwerts. -
INSUFFICIENT_DATA– Der Alarm wurde soeben gestartet; die Metrik ist nicht verfügbar oder es sind nicht genügend Daten verfügbar, damit die Metrik den Alarmstatus bestimmen kann.
Status der Alarmauswertung
Zusätzlich zum Alarmstatus hat jeder Alarm einen Bewertungsstatus, der Informationen über den Prozess der Alarmauswertung liefert. Die folgenden Zustände können auftreten:
-
PARTIAL_DATA— Weist darauf hin, dass aufgrund von Kontingentbeschränkungen nicht alle verfügbaren Daten abgerufen werden konnten. Weitere Informationen finden Sie unter Wie mit unvollständigen Daten umgegangen wird. -
EVALUATION_ERROR— Weist auf Konfigurationsfehler bei der Alarmeinrichtung hin, die überprüft und korrigiert werden müssen. Weitere Informationen finden Sie im StateReason Feld des Alarms. -
EVALUATION_FAILURE— Weist auf vorübergehende CloudWatch Probleme hin. Wir empfehlen eine manuelle Überwachung, bis das Problem behoben ist
Sie können den Evaluierungsstatus in den Alarmdetails in der Konsole oder mithilfe des describe-alarms CLI-Befehls oder der DescribeAlarms API anzeigen.
Einstellungen für die Alarmauswertung
Wenn Sie einen Alarm erstellen, geben Sie drei Einstellungen an, anhand derer Sie CloudWatch auswerten können, wann der Alarmstatus geändert werden muss:
-
Zeitraum ist die Zeitspanne, die für die Auswertung der Metrik oder des Ausdrucks verwendet wird, um jeden einzelnen Datenpunkt für einen Alarm zu erstellen. Sie wird in Sekunden angegeben.
-
Evaluation Periods (Auswertungszeiträume) ist die Anzahl der neuesten Zeiträume, oder Datenpunkte, die beim Ermitteln des Alarmzustands zu bewerten sind.
-
Datapoints to Alarm (Datenpunkte zum Alarm) ist die Anzahl der Datenpunkte innerhalb des Auswertungszeitraums, die überschritten werden müssen, um zu bewirken, dass der Alarm in den
ALARM-Status versetzt wird. Die überschrittenen Datenpunkte müssen nicht aufeinanderfolgend sein, aber sie müssen alle innerhalb der letzten Datenpunkte liegen (dem Auswertungszeitraum entsprechend).
Für einen Zeitraum von einer Minute oder länger wird jede Minute ein Alarm ausgewertet, und die Auswertung basiert auf dem durch den Zeitraum und die Bewertungszeiträume definierten Zeitfenster. Wenn der Zeitraum beispielsweise 5 Minuten (300 Sekunden) und der Bewertungszeiträume 1 ist, wird der Alarm am Ende von Minute 5 auf der Grundlage von Daten zwischen Minuten 1 und 5 ausgewertet. Am Ende von Minute 6 wird der Alarm dann auf der Grundlage der Daten aus den Minuten 2 bis 6 ausgewertet.
Wenn der Alarmzeitraum 10 Sekunden, 20 Sekunden oder 30 Sekunden beträgt, wird der Alarm alle 10 Sekunden ausgewertet. Weitere Informationen finden Sie unter Hochauflösende Alarme.
Wenn die Anzahl der Auswertungszeiträume für einen Alarm multipliziert mit der Länge der einzelnen Auswertungszeiträume einen Tag überschreitet, wird der Alarm einmal stündlich ausgewertet. Weitere Informationen darüber, wie diese mehrtägigen Alarme ausgewertet werden, finden Sie unterBeispiel für die Auswertung eines mehrtägigen Alarms.
In der folgenden Abbildung ist die Alarmschwelle für einen Metrikalarm auf drei Einheiten festgelegt. Sowohl der Auswertungszeitraum als auch die Datenpunkte zum Alarm sind 3. Das heißt, wenn alle vorhandenen Datenpunkte in den letzten drei aufeinanderfolgenden Perioden über dem Schwellenwert liegen, wechselt der Alarm in den Status ALARM. In der Abbildung geschieht dies im dritten bis zum fünften Zeitraum. Bei Zeitraum 6 fällt der Wert unter den Schwellenwert, sodass einer der auszuwertenden Zeiträume keinen Schwellenwert verletzt, und der Alarmstatus ändert sich wieder in OK. Im neunten Zeitraum wird der Schwellenwert erneut verletzt, jedoch nur für einen Zeitraum. Daher bleibt der Alarmstatus OK.
Wenn Sie Evaluation Periods (Auswertungszeiträume) und Datapoints to Alarm (Datenpunkte zum Alarm) als unterschiedliche Werte konfigurieren, legen Sie einen „M von N“-Alarm fest. Datenpunkte auf Alarm ist („M“) und Bewertungszeiträume sind („N“). Das Bewertungsintervall ist die Anzahl der Evaluierungsperioden multipliziert mit der Periodenlänge. Wenn Sie beispielsweise 4 von 5 Datenpunkten mit einem Zeitraum von 1 Minute konfigurieren, beträgt das Auswertungsintervall 5 Minuten. Wenn Sie 3 von 3 Datenpunkten mit einem Zeitraum von 10 Minuten konfigurieren, beträgt das Auswertungsintervall 30 Minuten.
Anmerkung
Wenn kurz nach der Erstellung eines Alarms Datenpunkte fehlen und die Metrik CloudWatch vor der Erstellung des Alarms gemeldet wurde, CloudWatch ruft es bei der Auswertung des Alarms die neuesten Datenpunkte ab, die vor der Erstellung des Alarms entstanden sind.
Hochauflösende Alarme
Wenn Sie einen Alarm für eine Metrik mit hoher Auflösung einrichten, können Sie einen Alarm mit hoher Auflösung mit einem Zeitraum von 10 Sekunden, 20 Sekunden oder 30 Sekunden angeben. Für hochauflösende Alarme ist eine höhere Gebühr zu zahlen. Weitere Informationen zu hochauflösenden Metriken finden Sie unter Veröffentlichen von benutzerdefinierten Metriken.
Beispiel für die Auswertung eines mehrtägigen Alarms
Ein Alarm ist ein mehrtägiger Alarm, wenn die Anzahl der Auswertungszeiträume multipliziert mit der Länge jedes Auswertungszeitraums einen Tag überschreitet. Mehrtägige Alarme werden einmal pro Stunde ausgewertet. Wenn mehrtägige Alarme ausgewertet werden, werden bei der Auswertung nur die Messwerte bis zur aktuellen Stunde in der Minute CloudWatch berücksichtigt.
Stellen Sie sich zum Beispiel einen Alarm vor, der einen Job überwacht, der alle 3 Tage um 10:00 Uhr ausgeführt wird.
-
Um 10:02 Uhr schlägt der Job fehl
-
Um 10:03 Uhr wird der Alarm ausgewertet und behält seinen Status
OKbei, da bei der Auswertung nur Daten bis 10:00 Uhr berücksichtigt werden. -
Um 11:03 Uhr berücksichtigt der Alarm Daten bis 11:00 Uhr und wechselt in den Status
ALARM. -
Um 11:43 Uhr korrigieren Sie den Fehler und der Job wird wieder erfolgreich ausgeführt.
-
Um 12:03 Uhr wird der Alarm erneut ausgewertet, erkennt den erfolgreichen Job und kehrt zum Status
OKzurück.