Container Insights avec OpenTelemetry métriques pour Amazon EKS - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Container Insights avec OpenTelemetry métriques pour Amazon EKS

Version préliminaire

Container Insights avec OpenTelemetry métriques fournit une visibilité sur l'état de fonctionnement de votre infrastructure de cluster Amazon EKS. Il est disponible en avant-première publique sans frais supplémentaires aux États-Unis Est (Virginie du Nord), à l'Ouest des États-Unis (Oregon), en Europe (Irlande), en Asie-Pacifique (Singapour) et en Asie-Pacifique (Sydney).

Le module complémentaire Amazon CloudWatch Observability EKS collecte des métriques open source à partir de vos clusters Amazon EKS et les envoie à CloudWatch l'aide du OpenTelemetry protocole (OTLP) avec une granularité de 30 secondes. Ces métriques utilisent des noms de métriques issus de leurs sources d'origine, notamment cAdvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics et Neuron Monitor. AWS Vous pouvez interroger ces métriques à l'aide de ProMQL dans CloudWatch Query Studio ou via l'API de requête compatible Prometheus.

Chaque métrique est automatiquement enrichie avec jusqu'à 150 étiquettes, y compris des attributs de convention OpenTelemetry sémantique et des étiquettes de pods et de nœuds Kubernetes. ProMQL gère l'agrégation au moment de la requête, de sorte que chaque métrique est publiée une fois par ressource plutôt qu'à plusieurs niveaux d'agrégation. Le module complémentaire met également en corrélation les métriques d'accélérateur de AWS Neuron et d' AWS Elastic Fabric Adapter avec les pods et conteneurs spécifiques qui les utilisent, offrant ainsi une visibilité qui n'est pas disponible uniquement à partir des sources métriques.

Pour activer OTel Container Insights sur un cluster Amazon EKS, installez la version complémentaire Amazon CloudWatch Observability EKS v6.0.1-eksbuild.1 ou une version ultérieure via la console Amazon EKS ou via l'infrastructure sous forme de code.

Pour plus d'informations sur la configuration de OTel Container Insights, consultezConfiguration de Container Insights.

Pour plus d'informations sur l'interrogation de ces métriques avec ProMQL, consultez. Requête ProMAL

Comparaison entre OTel Container Insights et Container Insights (amélioré)

Le tableau suivant résume les différences entre Container Insights (amélioré) et OTel Container Insights.

Fonctionnalité Container Insights (amélioré) OTel Informations sur les conteneurs
Noms des métriques CloudWatch-format les métriques (par exemple,pod_cpu_utilization) Natif open source (par exemple,container_cpu_usage_seconds_total)
Étiquettes par métrique 3 à 6 dimensions prédéfinies par métrique Jusqu'à 150 étiquettes, y compris toutes les étiquettes des pods et des nœuds Kubernetes
Agrégation Préagrégé à plusieurs niveaux (cluster, espace de noms, charge de travail, pod) Métriques brutes par ressource ; agrégées au moment de la requête avec ProMQL
Langage de requête CloudWatch API de métriques ProMQL (compatible avec Prometheus)
Ingestion métrique CloudWatch Logs au format EMF Point de terminaison OTLP

Comment les métriques sont étiquetées

Chaque métrique collectée par OTel Container Insights comporte des étiquettes provenant de trois sources.

Libellés natifs des sources de télémétrie

Étiquettes issues de la source métrique d'origine (par exemple, cAdvisor fournit des étiquettes telles que podnamespace, etcontainer). Ils sont conservés sous forme d'attributs de point de données.

OpenTelemetry attributs de ressources

Le module complémentaire ajoute des attributs de ressources conformément aux conventions OpenTelemetry sémantiques pour Kubernetes, Host et Cloud, telles quek8s.pod.name,,, et. k8s.namespace.name k8s.node.name host.name cloud.region Ces attributs sont cohérents dans toutes les sources métriques.

Étiquettes des pods et des nœuds Kubernetes

Toutes les étiquettes de pod et de nœud découvertes à partir de l'API Kubernetes sont ajoutées sous forme d'attributs de ressource avec les préfixes et. k8s.pod.label k8s.node.label

Pour plus d'informations sur la façon d'interroger ces attributs à l'aide de ProMQL, consultez. Requête ProMAL

Métriques prises en charge

Le tableau suivant répertorie les sources et catégories de métriques collectées par OTel Container Insights.

Source de la métrique Catégorie de la métrique Conditions préalables
cViseur Métriques de processeur -
cViseur Métrique de mémoire -
cViseur Métriques de réseau -
cViseur Métriques relatives aux disques et aux systèmes de fichiers -
Exportateur de nœuds Prometheus Métriques de processeur -
Exportateur de nœuds Prometheus Métrique de mémoire -
Exportateur de nœuds Prometheus Métriques de disque -
Exportateur de nœuds Prometheus Métriques du système de fichiers -
Exportateur de nœuds Prometheus Métriques de réseau -
Exportateur de nœuds Prometheus Métriques du système -
Exportateur de nœuds Prometheus VMStat métriques -
Exportateur de nœuds Prometheus Netstat et métriques des sockets -
NVIDIA DCGM Indicateurs de performance et d'utilisation du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM Métriques de mémoire du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM Indicateurs de puissance et de température du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM Métriques de régulation du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM Indicateurs d'erreur et de fiabilité du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM NVLink Métriques du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM Métriques informatives du GPU Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
AWS Moniteur Neuron NeuronCore métriques Le pilote Neuron et le plug-in du périphérique Neuron doivent être installés.
AWS Moniteur Neuron NeuronDevice métriques Le pilote Neuron et le plug-in du périphérique Neuron doivent être installés.
AWS Moniteur Neuron Métriques du système neuronal Le pilote Neuron et le plug-in du périphérique Neuron doivent être installés.
AWS Adaptateur en tissu élastique Métriques EFA Le plug-in pour appareil EFA doit être installé.
NVMe NVMe Métriques SMART -
Métriques de l'état de Kube Pod, node, Deployment DaemonSet StatefulSet, ReplicaSet,, Job CronJob,, Service, Namespace PersistentVolume, métriques PersistentVolumeClaim -
Serveur d'API Kubernetes Serveur API et métriques etcd -