ECR-Berechtigungen Protokolle Fehlermeldungen

Beheben von Problemen mit Inferenz-Pipelines

Verwenden Sie CloudWatch Protokolle und Fehlermeldungen, um Probleme mit der Inferenzpipeline zu beheben. Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die in Amazon SageMaker AI integrierte Algorithmen enthält, können auch Berechtigungsprobleme auftreten. Um die erforderlichen Berechtigungen zu erteilen, erstellen Sie eine Amazon Elastic Container Registry (Amazon ECR)-Richtlinie.

Themen

Beheben von Problemen mit Amazon ECR-Berechtigungen für Inferenz-Pipelines
Verwenden Sie CloudWatch Protokolle zur Fehlerbehebung bei SageMaker KI-Inferenz-Pipelines
Verwenden von Fehlermeldungen zum Beheben von Problemen mit Inferenz-Pipelines.

Beheben von Problemen mit Amazon ECR-Berechtigungen für Inferenz-Pipelines

Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die integrierte SageMaker KI-Algorithmen enthält, benötigen Sie eine Amazon ECR-Richtlinie. Die Richtlinie ermöglicht es Ihrem Amazon ECR-Repository, SageMaker KI die Erlaubnis zu erteilen, das Bild abzurufen. Die Richtlinie muss die folgenden Berechtigungen hinzufügen:

Verwenden Sie CloudWatch Protokolle zur Fehlerbehebung bei SageMaker KI-Inferenz-Pipelines

SageMaker KI veröffentlicht die Container-Logs für Endpunkte, die eine Inferenz-Pipeline für Amazon bereitstellen, CloudWatch unter dem folgenden Pfad für jeden Container.


/aws/sagemaker/Endpoints/{EndpointName}/{Variant}/{InstanceId}/{ContainerHostname}

Beispiel: Protokolle für diesen Endpunkt werden in den folgenden Protokollgruppen und Streams veröffentlicht:


EndpointName: MyInferencePipelinesEndpoint
Variant: MyInferencePipelinesVariant
InstanceId: i-0179208609ff7e488
ContainerHostname: MyContainerName1 and MyContainerName2


logGroup: /aws/sagemaker/Endpoints/MyInferencePipelinesEndpoint
logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName1
logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName2

Ein Protokollstream ist eine Abfolge von Protokollereignissen, die dieselbe Quelle nutzen. Jede einzelne Logquelle CloudWatch bildet einen separaten Log-Stream. Eine Protokollgruppe ist eine Gruppe von Protokollstreams, die dieselben Einstellungen für die Aufbewahrung, Überwachung und Zugriffskontrolle besitzen.

Anzeigen der Protokollgruppen und -streams

Öffnen Sie die CloudWatch Konsole unter https://console.aws.amazon.com/cloudwatch/.
Wählen Sie auf der Navigationsseite Logs (Protokolle).
Filtern Sie unter Log Groups (Protokollgruppen) nach MyInferencePipelinesEndpoint:
Um die Protokollstreams anzuzeigen, wählen Sie MyInferencePipelinesEndpoint auf der Seite CloudWatch Protokollgruppen die Option Protokollgruppe suchen aus.

Eine Liste der Protokolle, die SageMaker AI veröffentlicht, finden Sie unterProtokolle und Metriken der Inferenz-Pipeline.

Verwenden von Fehlermeldungen zum Beheben von Problemen mit Inferenz-Pipelines.

Die Inferenz-Pipeline-Fehlermeldungen geben an, welcher Container fehlgeschlagen ist.

Wenn beim Aufrufen eines Endpunkts durch SageMaker KI ein Fehler auftritt, gibt der Dienst einen Fehler zurück ModelError (Fehlercode 424), der angibt, welcher Container ausgefallen ist. Wenn die Nutzlast der Anfrage (die Antwort des vorherigen Containers) das Limit von 5 MB überschreitet, gibt SageMaker AI eine detaillierte Fehlermeldung aus, z. B.:

Antwort von MyContainerName1 mit dem Statuscode 200 erhalten. Die Nutzlast der Anfrage von MyContainerName1 bis MyContainerName2 beträgt jedoch 6000000 Byte, was die maximale Grenze von 5 MB überschritten hat.

Wenn ein Container die Ping-Zustandsprüfung nicht besteht, während SageMaker KI einen Endpunkt erstellt, gibt er a zurück ClientError und gibt alle Container an, die die Ping-Überprüfung bei der letzten Integritätsprüfung nicht bestanden haben.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Protokolle und Metriken

Endpunkte und Ressourcen löschen