Überwachung langlebiger Funktionen - AWS Lambda

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung langlebiger Funktionen

Sie können Ihre dauerhaften Funktionen mithilfe von CloudWatch Metriken, CloudWatch Protokollen und Tracing überwachen. Da langlebige Funktionen über längere Zeiträume ausgeführt werden können und sich über mehrere Funktionsaufrufen erstrecken, erfordert ihre Überwachung das Verständnis ihrer jeweiligen Ausführungsmuster, einschließlich Checkpoints, Zustandsübergängen und Wiedergabeverhalten.

CloudWatch Metriken

Lambda veröffentlicht automatisch Metriken ohne zusätzliche Kosten. CloudWatch Dauerhafte Funktionen bieten zusätzliche Metriken, die über die Standard-Lambda-Metriken hinausgehen, und unterstützen Sie bei der Überwachung von Workflows mit langer Laufzeit, der Statusverwaltung und der Ressourcennutzung.

Zuverlässige Ausführungsmetriken

Lambda gibt die folgenden Metriken für dauerhafte Ausführungen aus:

Metrik Description
ApproximateRunningDurableExecutions Anzahl der dauerhaften Ausführungen im Status RUNNING
ApproximateRunningDurableExecutionsUtilization Prozentsatz des derzeit in Anspruch genommenen maximalen Kontingents für laufende dauerhafte Ausführungen Ihres Kontos
DurableExecutionDuration Verstrichene Zeit in Millisekunden, während der eine dauerhafte Ausführung im Status RUNNING verharrte
DurableExecutionStarted Anzahl der begonnenen dauerhaften Ausführungen
DurableExecutionStopped Anzahl der dauerhaften Ausführungen, die die API nicht mehr verwenden StopDurableExecution
DurableExecutionSucceeded Anzahl der dauerhaften Ausführungen, die erfolgreich abgeschlossen wurden
DurableExecutionFailed Anzahl der dauerhaften Ausführungen, die mit einem Fehler abgeschlossen wurden
DurableExecutionTimedOut Anzahl der dauerhaften Ausführungen, die ihr konfiguriertes Ausführungstimeout überschritten haben
DurableExecutionOperations Gesamtzahl der Operationen, die innerhalb einer dauerhaften Ausführung ausgeführt wurden (max. 3.000)
DurableExecutionStorageWrittenBytes Kumulierte Datenmenge in Byte, die bei einer dauerhaften Ausführung beibehalten wurde (max.: 100 MB)

CloudWatch Metriken

Lambda gibt Standardmetriken für Aufruf, Leistung und Parallelität für langlebige Funktionen aus. Da sich eine dauerhafte Ausführung über mehrere Funktionsaufrufen erstrecken kann, während sie Checkpoints und Wiederholungen durchläuft, verhalten sich diese Metriken anders als bei Standardfunktionen:

  • Aufrufe: Zählt jeden Funktionsaufruf, einschließlich Wiederholungen. Eine einzige dauerhafte Ausführung kann mehrere Aufruf-Datenpunkte generieren.

  • Dauer: Misst jeden Funktionsaufruf separat. Wird DurableExecutionDuration für die Gesamtzeit verwendet, die eine einzelne dauerhafte Ausführung benötigt hat.

  • Fehler: Verfolgt Fehler beim Aufrufen von Funktionen. Wird DurableExecutionFailed für Fehler auf Ausführungsebene verwendet.

Eine vollständige Liste der Standard-Lambda-Metriken finden Sie unter Typen von Metriken für Lambda-Funktionen.

Alarme erstellen CloudWatch

Erstellen Sie CloudWatch Alarme, um Sie zu benachrichtigen, wenn Messwerte Schwellenwerte überschreiten. Zu den häufigsten Alarmen gehören:

  • ApproximateRunningDurableExecutionsUtilizationüberschreitet 80% Ihres Kontingents

  • DurableExecutionFailedsteigt über einen Schwellenwert

  • DurableExecutionTimedOutweist darauf hin, dass bei Hinrichtungen ein Timeout eintritt

  • DurableExecutionStorageWrittenBytesnähert sich den Speichergrenzen

Weitere Informationen finden Sie unter CloudWatch Alarme verwenden.

.

EventBridge Ereignisse

Lambda veröffentlicht dauerhafte Ereignisse zur Änderung des Ausführungsstatus unter. EventBridge Sie können diese Ereignisse verwenden, um Workflows auszulösen, Benachrichtigungen zu senden oder Änderungen des Ausführungslebenszyklus in Ihren dauerhaften Funktionen nachzuverfolgen.

Ereignisse zur Änderung des Status dauerhafter Ausführung

Lambda gibt jedes Mal ein Ereignis aus, EventBridge wenn sich der Status einer dauerhaften Ausführung ändert. Diese Ereignisse weisen die folgenden Merkmale auf:

  • Quelle: aws.lambda

  • Art des Details: Durable Execution Status Change

Statusänderungsereignisse werden für die folgenden Ausführungsstatus veröffentlicht:

  • RUNNING- Die Ausführung wurde gestartet

  • SUCCEEDED- Die Ausführung wurde erfolgreich abgeschlossen

  • STOPPED- Die Ausführung wurde mithilfe der StopDurableExecution API gestoppt

  • FAILED- Die Ausführung ist mit einem Fehler fehlgeschlagen

  • TIMED_OUT- Die Ausführung hat das konfigurierte Timeout überschritten

Das folgende Beispiel zeigt ein dauerhaftes Ereignis zur Änderung des Ausführungsstatus:

{ "version": "0", "id": "d019b03c-a8a3-9d58-85de-241e96206538", "detail-type": "Durable Execution Status Change", "source": "aws.lambda", "account": "123456789012", "time": "2025-11-20T13:08:22Z", "region": "us-east-1", "resources": [], "detail": { "durableExecutionArn": "arn:aws:lambda:us-east-1:123456789012:function:my-function:$LATEST/durable-execution/090c4189-b18b-4296-9d0c-cfd01dc3a122/9f7d84c9-ea3d-3ffc-b3e5-5ec51c34ffc9", "durableExecutionName": "order-123", "functionArn": "arn:aws:lambda:us-east-1:123456789012:function:my-function:2", "status": "RUNNING", "startTimestamp": "2025-11-20T13:08:22.345Z" } }

Bei Terminalzuständen (SUCCEEDEDSTOPPED,,FAILED,TIMED_OUT) umfasst das Ereignis ein endTimestamp Feld, das angibt, wann die Ausführung abgeschlossen wurde.

EventBridge Regeln erstellen

Erstellen Sie Regeln, um dauerhafte Ereignisse zur Änderung des Ausführungsstatus an Ziele wie Amazon Simple Notification Service, Amazon Simple Queue Service oder andere Lambda-Funktionen weiterzuleiten.

Im folgenden Beispiel wird eine Regel erstellt, die allen Änderungen des Status der dauerhaften Ausführung entspricht:

{ "source": ["aws.lambda"], "detail-type": ["Durable Execution Status Change"] }

Im folgenden Beispiel wird eine Regel erstellt, die nur auf fehlgeschlagene Ausführungen zutrifft:

{ "source": ["aws.lambda"], "detail-type": ["Durable Execution Status Change"], "detail": { "status": ["FAILED"] } }

Im folgenden Beispiel wird eine Regel erstellt, die Statusänderungen für eine bestimmte Funktion abgleicht:

{ "source": ["aws.lambda"], "detail-type": ["Durable Execution Status Change"], "detail": { "functionArn": [{ "prefix": "arn:aws:lambda:us-east-1:123456789012:function:my-function" }] } }

Weitere Informationen zum Erstellen von Regeln finden Sie in den EventBridge Amazon-Tutorials im EventBridge Benutzerhandbuch.

AWS X-Ray Rückverfolgung

Sie können die Röntgenverfolgung für Ihre dauerhaften Funktionen aktivieren. Lambda übergibt den X-Ray-Trace-Header an die dauerhafte Ausführung, sodass Sie Anfragen in Ihrem gesamten Workflow verfolgen können.

Um X-Ray; Tracing mit der Lambda-Konsole zu aktivieren, wählen Sie Ihre Funktion aus, wählen Sie dann Configuration, Monitoring and Operations Tools und aktivieren Sie Active Tracing unter X-Ray.

Um X-Ray Tracing zu aktivieren, verwenden Sie: AWS CLI

aws lambda update-function-configuration \ --function-name my-durable-function \ --tracing-config Mode=Active

Um die AWS X-Ray Ablaufverfolgung zu aktivieren, verwenden Sie: AWS SAM

Resources: MyDurableFunction: Type: AWS::Serverless::Function Properties: Tracing: Active DurableConfig: ExecutionTimeout: 3600

Weitere Informationen zu X-Ray finden Sie im AWS X-Ray Developer Guide.