Alarmes et journaux pour le suivi des métriques provenant des points de terminaison sans serveur - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Alarmes et journaux pour le suivi des métriques provenant des points de terminaison sans serveur

Pour contrôler votre point de terminaison sans serveur, vous pouvez utiliser les alarmes Amazon CloudWatch. CloudWatch est un service qui collecte des métriques en temps réel à partir de vos applications et ressources AWS. Une alarme contrôle les métriques au fur et à mesure qu’elles sont collectées et vous donne la possibilité de préspécifier un seuil et les actions à entreprendre si ce seuil est dépassé. Par exemple, votre alarme CloudWatch peut vous envoyer une notification si votre point de terminaison dépasse un seuil d’erreur. En configurant des alarmes CloudWatch, vous gagnez en visibilité sur les performances et les fonctionnalités de votre point de terminaison. Pour plus d’informations sur les alarmes CloudWatch, consultez Utilisation d’alarmes Amazon CloudWatch dans le Guide de l’utilisateur Amazon CloudWatch.

Surveillance avec CloudWatch

Voici une liste exhaustive des métriques pour les points de terminaison sans serveur. Toute métrique non répertoriée ci-dessous n’est pas publiée pour les points de terminaison sans serveur. Pour en savoir plus sur les métriques suivantes, consultez Surveillance d’Amazon SageMaker AI avec Amazon CloudWatch.

Métriques de point de terminaison courantes

Ces métriques CloudWatch sont les mêmes que celles publiées pour les points de terminaison en temps réel.

La métrique OverheadLatency suit toute la latence supplémentaire ajoutée par SageMaker AI, y compris le temps de démarrage à froid de lancement de nouvelles ressources de calcul pour votre point de terminaison sans serveur. Comparé aux points de terminaison sans serveur à la demande, la OverheadLatency des points de terminaison sans serveur dotés de la simultanéité provisionnée est généralement nettement inférieure.

Les points de terminaison sans serveur peuvent également utiliser les métriques Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime et MemoryUtilization. Pour en savoir plus sur ces mesures, consultez SageMaker Métriques d'invocation des terminaux AI.

Métriques de point de terminaison sans serveur courantes

Ces métriques CloudWatch sont publiées à la fois pour les points de terminaison sans serveur à la demande et pour les points de terminaison sans serveur avec la simultanéité provisionnée.

Nom de la métrique Description Unité/Statistiques
ServerlessConcurrentExecutionsUtilization Le nombre d’exécutions simultanées divisé par la simultanéité maximum.

Unités : aucune

Statistiques valides : moyenne, maximum, minimum

Métriques d’un point de terminaison sans serveur avec la simultanéité provisionnée

Ces métriques CloudWatch sont publiées pour les points de terminaison sans serveur avec la simultanéité provisionnée.

Nom de la métrique Description Unité/Statistiques
ServerlessProvisionedConcurrencyExecutions Le nombre d’exécutions simultanées gérées par le point de terminaison.

Unités : nombre

Statistiques valides : moyenne, maximum, minimum

ServerlessProvisionedConcurrencyUtilization Le nombre d’exécutions simultanées divisé par la simultanéité provisionnée allouée.

Unités : aucune

Statistiques valides : moyenne, maximum, minimum

ServerlessProvisionedConcurrencyInvocations Le nombre de demandes InvokeEndpoint traitées par la simultanéité provisionnée.

Unités : nombre

Statistiques valides : moyenne, maximum, minimum

ServerlessProvisionedConcurrencySpilloverInvocations Le nombre de demandes InvokeEndpoint non traitées par la simultanéité provisionnée, qui sont gérées par u à la demande.

Unités : nombre

Statistiques valides : moyenne, maximum, minimum

Journaux

Si vous souhaitez contrôler les journaux de votre point de terminaison pour le débogage ou l’analyse de la progression, vous pouvez utiliser Amazon CloudWatch Logs. Le groupe de journaux fourni par SageMaker AI que vous pouvez utiliser pour les points de terminaison sans serveur est /aws/sagemaker/Endpoints/[EndpointName]. Pour plus d’informations sur l’utilisation de CloudWatch Logs dans SageMaker AI, consultez CloudWatch Journaux pour Amazon SageMaker AI. Pour en savoir plus sur CloudWatch Logs, consultez Qu’est-ce qu’Amazon CloudWatch Logs ? dans le Guide de l’utilisateur Amazon CloudWatch Logs.