Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Valutazione degli allarmi
Stati degli allarmi di parametri
Un allarme di parametri può trovarsi nei possibili stati elencati di seguito:
-
OK- Il parametro o espressione rientra nella soglia definita. -
ALARM- Il parametro o espressione non rientra nella soglia definita. -
INSUFFICIENT_DATA- L'allarme è stato appena attivato, il parametro non è disponibile o la quantità di dati non è sufficiente affinché il parametro determini lo stato dell'allarme.
Stato di valutazione degli allarmi
Oltre allo stato di allarme, ogni allarme ha uno stato di valutazione che fornisce informazioni sul processo di valutazione dell'allarme. Possono verificarsi i seguenti stati:
-
PARTIAL_DATA— Indica che non è stato possibile recuperare tutti i dati disponibili a causa delle limitazioni delle quote. Per ulteriori informazioni, consulta Come vengono gestiti i dati parziali. -
EVALUATION_ERROR— Indica errori di configurazione nella configurazione degli allarmi che richiedono revisione e correzione. Per maggiori dettagli, fare riferimento al StateReason campo dell'allarme. -
EVALUATION_FAILURE— Indica CloudWatch problemi temporanei. Si consiglia il monitoraggio manuale fino alla risoluzione del problema
È possibile visualizzare lo stato di valutazione nei dettagli dell'allarme nella console o utilizzando il comando describe-alarms CLI o DescribeAlarms l'API.
Impostazioni di valutazione degli allarmi
Quando si crea un allarme, si specificano tre impostazioni CloudWatch per consentire di valutare quando modificare lo stato dell'allarme:
-
Periodo è l'intervallo di tempo su cui valutare il parametro o l'espressione e creare ogni singolo punto di dati per un allarme. Viene espresso in secondi.
-
Evaluation Periods (Periodi di valutazione) è il numero di periodi più recenti, o punti di dati, per valutare quando stabilire lo stato di allarme.
-
Datapoints to Alarm (Punti di dati all'allarme) è il numero punti di dati all'interno dei periodi di valutazione che devono essere violati per fare in modo che l'allarme sia nello stato
ALARM. I punti dati oggetto della violazione non devono essere consecutivi, ma devono solo essere tutti all'interno dell'ultimo numero di punti dati pari all'Evaluation Period (Periodo di valutazione).
Per un periodo di almeno un minuto, un allarme viene valutato ogni minuto e la valutazione si basa sulla finestra temporale definita da Periodo e Periodi di valutazione. Ad esempio, se Periodo è di 5 minuti (300 secondi) e Periodi di valutazione è 1, alla fine del minuto 5 l'allarme viene valutato in base ai dati compresi tra 1 e 5 minuti. Quindi, alla fine del minuto 6, l'allarme viene valutato in base ai dati dal secondo al sesto minuto.
Se il periodo di allarme è di 10 secondi, 20 secondi o 30 secondi, l'allarme viene valutato ogni 10 secondi. Per ulteriori informazioni, consulta Allarmi ad alta risoluzione.
Se il numero di periodi di valutazione per un allarme moltiplicato per la durata di ciascun periodo di valutazione supera un giorno, l'allarme viene valutato una volta all'ora. Per ulteriori dettagli su come vengono valutati questi allarmi giornalieri, consulta. Esempio di valutazione di un allarme di più giorni
Nella figura seguente, la soglia di allarme per un allarme dei parametri è impostata su tre unità. Sia l'Evaluation Period (Periodo di valutazione) che Datapoints to Alarm (Punti di dati all'allarme) sono 3. Quando tutti i punti dati esistenti nei tre periodi consecutivi più recenti sono sopra la soglia, l'allarme passa allo stato ALARM. Nella figura, questo accade dal terzo al quinto periodo di tempo. Al periodo sei, il valore scende sotto la soglia, perciò uno dei periodi valutati non effettua una violazione e lo stato dell'allarme cambia in OK. Durante il nono periodo di tempo, la soglia viene nuovamente superata, ma per un solo periodo. Di conseguenza, lo stato dell'allarme rimane OK.
Quando si configura Evaluation Periods (Periodi di valutazione) e Datapoints to Alarm (Punti dati all'allarme) come valori diversi, si imposta un allarme "M su N". Datapoints to Alarm è («M») e Evaluation Periods è («N»). L'intervallo di valutazione è il numero di periodi di valutazione moltiplicato per la durata del periodo. Ad esempio, se configuri 4 punti dati su 5 con un periodo di 1 minuto, l'intervallo di valutazione è di 5 minuti. Se configuri 3 punti dati su 3 con un periodo di 10 minuti, l'intervallo di valutazione è di 30 minuti.
Nota
Se i punti dati mancano subito dopo la creazione di un allarme e la metrica veniva riportata CloudWatch prima della creazione dell'allarme, CloudWatch recupera i punti dati più recenti precedenti alla creazione dell'allarme durante la valutazione dell'allarme.
Allarmi ad alta risoluzione
Se imposti un allarme su una metrica ad alta risoluzione, puoi specificare un allarme ad alta risoluzione con un periodo di 10 secondi, 20 secondi o 30 secondi. Per gli allarmi ad alta risoluzione il costo è più elevato. Per ulteriori informazioni sui parametri ad alta risoluzione, consulta Publish custom metrics.
Esempio di valutazione di un allarme di più giorni
Un allarme è considerato un allarme di più giorni se il numero di periodi di valutazione moltiplicato per la durata di ciascun periodo di valutazione supera un giorno. Gli allarmi di più giorni vengono valutati una volta all'ora. Quando vengono valutati gli allarmi di più giorni, durante la valutazione CloudWatch tiene conto solo delle metriche fino all'ora corrente al minuto 00.
Ad esempio, consideriamo un allarme che monitora un processo che viene eseguito ogni 3 giorni alle 10:00.
-
Alle 10:02, il processo fallisce.
-
Alle 10:03, l'allarme viene valutato e rimane nello stato
OK, poiché la valutazione considera i dati solo fino alle 10:00. -
Alle 11:03, l'allarme considera i dati fino alle 11:00 e passa allo stato
ALARM. -
Alle 11:43, l'errore viene corretto e il processo ora viene eseguito correttamente.
-
Alle 12:03, l'allarme viene nuovamente valutato, rileva che il processo è riuscito e torna allo stato
OK.