Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Konfiguration der Behandlung fehlender Daten durch CloudWatch Alarme
Manchmal wird nicht jeder erwartete Datenpunkt für eine Metrik gemeldet CloudWatch. Dies kann z. B. der Fall sein, wenn eine Verbindung unterbrochen wird, ein Server ausfällt oder wenn eine Metrik Daten grundsätzlich nur intermittierend meldet.
CloudWatch ermöglicht es Ihnen, festzulegen, wie fehlende Datenpunkte bei der Auswertung eines Alarms behandelt werden sollen. Dies hilft Ihnen, Ihren Alarm so zu konfigurieren, dass er nur dann in den ALARM-Zustand wechselt, wenn dies für den überwachten Datentyp angemessen ist. Sie können Fehlalarme vermeiden, wenn fehlende Daten nicht auf ein Problem hinweisen.
Ähnlich wie sich jeder Alarm immer in einem von drei Zuständen befindet, CloudWatch fällt jeder spezifische Datenpunkt, an den gemeldet wird, in eine von drei Kategorien:
-
Keine Verletzung (innerhalb des Schwellenwerts)
-
Verletzung (verletzt den Schwellenwert)
-
Fehlen
Für jeden Alarm können Sie angeben CloudWatch , dass fehlende Datenpunkte wie folgt behandelt werden sollen:
-
notBreaching– Fehlende Datenpunkte werden als „gut“ und innerhalb der Schwelle liegend behandelt -
breaching– Fehlende Datenpunkte werden als „ungültig“ und außerhalb der Schwelle liegend behandelt -
ignore– Der aktuelle Alarmstatus wird beibehalten -
missing– Wenn alle Datenpunkte im Alarmauswertungsbereich fehlen, wechselt der Alarm zu INSUPFIZIENT_DATA.
Die beste Wahl ist abhängig von der Art der Metrik und dem Zweck des Alarms. Wenn Sie beispielsweise einen Anwendungs-Rollback-Alarm mithilfe einer Metrik erstellen, die kontinuierlich Daten meldet, sollten Sie fehlende Datenpunkte möglicherweise als Sicherheitsverletzung behandeln, da dies darauf hindeuten könnte, dass etwas nicht stimmt. Aber für eine Metrik, die nur Datenpunkte generiert, wenn ein Fehler auftritt, z. B. ThrottledRequests in Amazon DynamoDB, sollten Sie fehlende Daten als notBreaching behandeln. Das Standardverhalten ist missing.
Wichtig
Alarme, die für Amazon-EC2-Metriken konfiguriert sind, können vorübergehend in den INSUFFICIENT_DATA-Status wechseln, wenn metrische Datenpunkte fehlen. Dies ist selten, kann jedoch auftreten, wenn die metrische Berichterstattung unterbrochen wird, selbst wenn die Amazon-EC2-Instance fehlerfrei funktioniert. Für Alarme zu Amazon-EC2-Metriken, die so konfiguriert sind, dass sie Stopp-, Beenden-, Neustart- oder Wiederherstellungsaktionen ausführen, empfehlen wir, diese Alarme so zu konfigurieren, dass fehlende Daten als missing behandelt werden und dass diese Alarme nur ausgelöst werden, wenn sie sich im ALARM-Status befinden.
Wenn Sie die beste Option für Ihren Alarm wählen, werden unnötige und irreführende Änderungen an Alarmbedingungen verhindert und der Zustand Ihres Systems wird genauer angeben.
Wichtig
Alarme, die Metriken im AWS/DynamoDB Namespace auswerten, ignorieren standardmäßig fehlende Daten. Sie können dies überschreiben, wenn Sie eine andere Option dafür wählen, wie der Alarm fehlende Daten behandeln soll. Wenn für eine AWS/DynamoDB-Metrik Daten fehlen, verbleiben Alarme, die diese Metrik auswerten, in ihrem aktuellen Zustand.
Wie der Alarmstatus bei fehlenden Daten ausgewertet wird
Immer wenn ein Alarm auswertet, ob der Status geändert werden soll, CloudWatch versucht er, eine höhere Anzahl von Datenpunkten abzurufen als die als Bewertungszeiträume angegebene Zahl. Die genaue Anzahl der Datenpunkte, die er abzurufen versucht, hängt von der Länge des Alarmzeitraums und davon ab, ob er auf einer Metrik mit Standardauflösung oder hoher Auflösung basiert. Der Zeitrahmen der Datenpunkte, die sie abzurufen versucht, ist der Auswertungsbereich.
Sobald diese Datenpunkte CloudWatch abgerufen wurden, passiert Folgendes:
-
Wenn keine Datenpunkte im Bewertungsbereich fehlen, wird der Alarm anhand der zuletzt erfassten Datenpunkte CloudWatch ausgewertet. Die Anzahl der ausgewerteten Datenpunkte entspricht den Auswertungszeiträumen für den Alarm. Die zusätzlichen Datenpunkte von weiter hinten im Auswertungsbereich werden nicht benötigt und ignoriert.
-
Wenn einige Datenpunkte im Bewertungsbereich fehlen, aber die Gesamtzahl der vorhandenen Datenpunkte, die erfolgreich aus dem Bewertungsbereich abgerufen wurden, gleich oder größer als die Bewertungszeiträume des Alarms ist, CloudWatch bewertet der Alarmstatus auf der Grundlage der letzten erfolgreich abgerufenen realen Datenpunkte, einschließlich der erforderlichen zusätzlichen Datenpunkte, die weiter hinten im Bewertungsbereich liegen. In diesem Fall wird der von Ihnen eingestellte Wert für die Behandlung fehlender Daten nicht benötigt und ignoriert.
-
Wenn einige Datenpunkte im Bewertungsbereich fehlen und die Anzahl der tatsächlich abgerufenen Datenpunkte niedriger ist als die Anzahl der Evaluierungsperioden des Alarms, CloudWatch füllt die fehlenden Datenpunkte mit dem Ergebnis auf, das Sie für die Behandlung fehlender Daten angegeben haben, und wertet dann den Alarm aus. Es werden jedoch alle realen Datenpunkte im Bewertungsbereich in die Auswertung einbezogen. CloudWatch verwendet fehlende Datenpunkte nur so selten wie möglich.
Anmerkung
Ein besonderer Fall dieses Verhaltens besteht darin, dass CloudWatch Alarme den letzten Satz von Datenpunkten für einen bestimmten Zeitraum wiederholt neu auswerten, nachdem die Metrik aufgehört hat zu fließen. Diese Neuauswertung kann dazu führen, dass der Alarm den Status ändert und Aktionen erneut ausführt, wenn er den Status unmittelbar vor dem Stoppen des Messdatenstroms geändert hatte. Um dieses Verhalten zu verhindern, verwenden Sie kürzere Zeiträume.
Die folgenden Tabellen zeigen Beispiele für das Verhalten der Alarmauswertung. In der ersten Tabelle haben die Datenpunkte für Alarm - und Bewertungszeiträume jeweils den Wert 3. CloudWatch ruft bei der Auswertung des Alarms die 5 neuesten Datenpunkte ab, falls einige der letzten 3 Datenpunkte fehlen. 5 ist der Bewertungsbereich für den Alarm.
In Spalte 1 werden die fünf letzten Datenpunkte angezeigt, da der Auswertungsbereich 5 beträgt. Diese Datenpunkte werden mit dem letzten Datenpunkt auf der rechten Seite angezeigt. 0 ist ein nicht überschreitender Datenpunkt, X ein überschreitender Datenpunkt und - ein fehlender Datenpunkt.
In Spalte 2 ist angegeben, wie viele der 3 erforderlichen Datenpunkte fehlen. Obwohl die 5 zuletzt hinzugekommenen Datenpunkte ausgewertet werden, sind zur Bewertung des Alarmstatus nur 3 davon nötig (gemäß der Einstellung für Evaluation Periods (Auswertungszeiträume)). Die Anzahl der Datenpunkte in Spalte 2 ist die Anzahl der Datenpunkte, die ausgefüllt sein muss. Dabei wird die Einstellung zur Behandlung fehlender Daten verwendet.
In den Spalten 3-6 sind die Spaltenüberschriften die möglichen Werte für die Behandlung fehlender Daten. Die Zeilen in diesen Spalten zeigen den Alarmstatus an, der für jede dieser möglichen Methoden zur Behandlung fehlender Daten festgelegt ist.
| Datenpunkte | Anzahl der Datenpunkte, die ausgefüllt werden müssen | MISSING | IGNORE | ÜBERSCHREITEND | NICHT ÜBERSCHREITEND |
|---|---|---|---|---|---|
|
0 - X - X |
0 |
|
|
|
|
|
- - - - 0 |
2 |
|
|
|
|
|
- - - - - |
3 |
|
Aktuellen Status beibehalten |
|
|
|
0 X X - X |
0 |
|
|
|
|
|
- - X - - |
2 |
|
Aktuellen Status beibehalten |
|
|
In der zweiten Zeile der vorhergehenden Tabelle bleibt der Alarm OK, auch wenn fehlende Daten als Überschreitung behandelt werden, weil der eine vorhandene Datenpunkt nicht überschreitend ist. Dies wird zusammen mit zwei fehlenden Datenpunkten ausgewertet, die als Überschreitung behandelt werden. Wenn dieser Alarm das nächste Mal ausgewertet wird, werden die Daten, die noch fehlen, auf ALARM gesetzt, da dieser nicht verletzende Datenpunkt nicht mehr im Auswertebereich liegt.
Die dritte Zeile, in der alle fünf letzten Datenpunkte fehlen, veranschaulicht, wie sich die verschiedenen Einstellungen für die Behandlung fehlender Daten auf den Alarmzustand auswirken. Wenn fehlende Datenpunkte als Verletzung betrachtet werden, geht der Alarm in den ALARM-Status, während, wenn sie als nicht verletzt betrachtet werden, dann geht der Alarm in den OK-Zustand über. Wenn fehlende Datenpunkte ignoriert werden, behält der Alarm den aktuellen Zustand vor den fehlenden Datenpunkten bei. Und wenn fehlende Datenpunkte nur als fehlend angesehen werden, dann hat der Alarm nicht genügend aktuelle reale Daten, um eine Auswertung durchzuführen und geht in den Zustand INSUFFIZIENT_DATA.
In der vierten Zeile geht der Alarm in allen Fällen in den Zustand ALARM über, da die drei jüngsten Datenpunkte verletzt werden und die Auswertungszeiträume und Datenpunkte zum Alarm des Alarms beide auf 3 gesetzt sind. In diesem Fall wird der fehlende Datenpunkt ignoriert und die Einstellung für die Auswertung fehlender Daten ist nicht erforderlich, da drei reale Datenpunkte ausgewertet werden müssen.
Zeile 5 stellt einen Sonderfall der Alarmauswertung dar, der als vorzeitiger Alarmzustand bezeichnet wird. Weitere Informationen finden Sie unter Vermeidung vorzeitiger Übergänge in den Alarmzustand.
In der nächsten Tabelle ist Period (Zeitraum) erneut auf 5 Minuten gesetzt, und Datapoints to Alarm (Datenpunkte zum Alarm) ist nur 2, während Evaluation Periods (Auswertungszeiträume) 3 ist. Die ist ein 2-aus-3, M-aus-N-Alarm.
Der Auswertungsbereich beträgt 5. Dies ist die maximale Anzahl der zuletzt abgerufenen Datenpunkte und kann verwendet werden, falls einige Datenpunkte fehlen.
| Datenpunkte | Anzahl fehlender Datenpunkte | FEHLEND | IGNORE | ÜBERSCHREITEND | NICHT ÜBERSCHREITEND |
|---|---|---|---|---|---|
|
0 - X - X |
0 |
|
|
|
|
|
0 0 X 0 X |
0 |
|
|
|
|
|
0 - X - - |
1 |
|
|
|
|
|
- - - - 0 |
2 |
|
|
|
|
|
- - - - X |
2 |
|
Aktuellen Status beibehalten |
|
|
In den Zeilen 1 und 2 geht der Alarm immer in den ALARM-Zustand, da 2 der 3 letzten Datenpunkte verletzt werden. In Zeile 2 werden die beiden ältesten Datenpunkte im Auswertebereich nicht benötigt, da keiner der 3 jüngsten Datenpunkte fehlt, daher werden diese beiden älteren Datenpunkte ignoriert.
In den Zeilen 3 und 4 geht der Alarm nur dann in den ALARM-Zustand, wenn fehlende Daten als Verletzung behandelt werden. In diesem Fall werden die beiden letzten fehlenden Datenpunkte beide als Verletzung behandelt. In Zeile 4 stellen diese beiden fehlenden Datenpunkte, die als Verletzung behandelt werden, die zwei notwendigen Datenpunkte bereit, um den ALARM-Zustand auszulösen.
Zeile 5 stellt einen Sonderfall der Alarmauswertung dar, der als vorzeitiger Alarmzustand bezeichnet wird. Weitere Informationen finden Sie im folgenden Abschnitt.
Vermeidung vorzeitiger Übergänge in den Alarmzustand
CloudWatch Die Auswertung von Alarmen beinhaltet Logik zur Vermeidung von Fehlalarmen, bei denen der Alarm vorzeitig in den ALARM-Zustand übergeht, wenn die Daten unterbrochen werden. Das Beispiel, das in Zeile 5 in den Tabellen im vorherigen Abschnitt gezeigt wird, veranschaulicht diese Logik. In diesen Zeilen und in den folgenden Beispielen beträgt der Auswertungszeitraum 3 und der Auswertungsbereich 5 Datenpunkte. Datenpunkte zum Alarm sind 3, mit Ausnahme des Beispiels M von N, wo Datenpunkte zum Alarm 2 sind.
Angenommen, die neuesten Daten eines Alarms sind - - - - X, mit vier fehlenden Datenpunkten und dann einem Datenpunkt, der verletzt wird, als neuestem Datenpunkt. Da der nächste Datenpunkt möglicherweise nicht verletzt wird, geht der Alarm nicht sofort in den ALARM-Zustand, wenn die Daten entweder - - - - X oder - - - X - sind und Datenpunkte zum Alarm 3 sind. Auf diese Weise werden Fehlalarme vermieden, wenn der nächste Datenpunkt nicht verletzt wird und dazu führt, dass die Daten - - - X O oder - - X - O sind.
Wenn jedoch die letzten paar Datenpunkte - - X - - sind, geht der Alarm in den ALARM-Zustand, auch wenn fehlende Datenpunkte als fehlend behandelt werden. Dies liegt daran, dass Alarme immer in den ALARM-Zustand gehen, wenn der älteste verfügbare verletzende Datenpunkt in der Anzahl der Datenpunkte während der Auswertungszeiträume mindestens so alt ist wie der Wert von Mit Alarm zu versehende Datenpunkte und alle anderen neueren Datenpunkte eine Verletzung darstellen oder fehlen. In diesem Fall geht der Alarm auch dann in den ALARM-Zustand, wenn die Gesamtzahl der verfügbaren Datenpunkte kleiner als M (Datenpunkte zum Alarm) ist.
Diese Alarmlogik gilt auch für „M von N“ Alarme. Wenn der älteste verletzte Datenpunkt während des Auswertungsbereichs mindestens so alt ist wie der Wert von Datenpunkte zum Alarm und alle neueren Datenpunkte entweder verletzt oder fehlen, geht der Alarm unabhängig vom Wert von M (Datenpunkte zum Alarm).
Fehlende Daten in CloudWatch Metrics Insights-Alarmen
Alarme basieren auf Metrics Insights-Abfragen, die zu einer einzigen Zeitreihe zusammengefasst werden
Die Szenarien mit fehlenden Daten und ihre Auswirkungen auf die Auswertung von Alarmen entsprechen in Bezug auf die konfigurierte Behandlung fehlender Daten denen eines standardmäßigen metrischen Alarms. Siehe Konfiguration der Behandlung fehlender Daten durch CloudWatch Alarme.
Alarme basieren auf Abfragen von Metrics Insights, die mehrere Zeitreihen erzeugen
Szenarien mit fehlenden Daten für Alarme von Metrics Insights treten auf, wenn:
-
Einzelne Datenpunkte innerhalb einer Zeitreihe sind nicht vorhanden.
-
Eine oder mehrere Zeitreihen verschwinden, wenn mehrere Zeitreihen ausgewertet werden.
-
Durch die Abfrage werden keine Zeitreihen abgerufen.
Szenarien mit fehlenden Daten wirken sich wie folgt auf die Alarmauswertung aus:
-
Bei der Auswertung einer Zeitreihe wird die Behandlung fehlender Daten auf einzelne Datenpunkte innerhalb der Zeitreihe angewendet. Wenn beispielsweise 3 Datenpunkte für die Zeitreihe abgefragt wurden, aber nur 1 empfangen wurde, würden 2 Datenpunkte auf die konfigurierte Konfiguration fehlender Daten folgen.
-
Wenn eine Zeitreihe von der Abfrage nicht mehr abgerufen wird, wird sie
OKunabhängig von der Behandlung fehlender Daten in die Datenbank übergehen. Alarmaktionen im Zusammenhang mit demOKÜbergang auf der Ebene der Mitwirkenden werden ausgeführt undStateReasongeben an, dass der oben genannte Mitwirkende nicht gefunden wurde. Es wird die Meldung „Für diesen Mitwirkenden wurden keine Daten zurückgegeben“ angezeigt. Der Status des Alarms hängt vom Status der anderen Mitwirkenden ab, die durch die Abfrage abgerufen wurden. -
Wenn die Abfrage auf Alarmebene ein leeres Ergebnis zurückgibt (überhaupt keine Zeitreihe), geht der Alarm unabhängig von der eingestellten fehlenden Datenbehandlung in den Alarm über.
INSUFFICIENT_DATA