Comparaison entre OTel Container Insights et Container Insights (amélioré)Comment les métriques sont étiquetées Métriques prises en charge Désactiver la double publication

Container Insights avec OpenTelemetry métriques pour Amazon EKS

Version préliminaire

Container Insights avec OpenTelemetry métriques fournit une visibilité sur l'état de fonctionnement de votre infrastructure de cluster Amazon EKS. Il est disponible en avant-première publique sans frais supplémentaires aux États-Unis Est (Virginie du Nord), à l'Ouest des États-Unis (Oregon), en Europe (Irlande), en Asie-Pacifique (Singapour) et en Asie-Pacifique (Sydney).

Le module complémentaire Amazon CloudWatch Observability EKS collecte des métriques open source à partir de vos clusters Amazon EKS et les envoie à CloudWatch l'aide du OpenTelemetry protocole (OTLP) avec une granularité de 30 secondes. Ces métriques utilisent des noms de métriques issus de leurs sources d'origine, notamment cAdvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics et Neuron Monitor. AWS Vous pouvez interroger ces métriques à l'aide de ProMQL dans CloudWatch Query Studio ou via l'API de requête compatible Prometheus.

Chaque métrique est automatiquement enrichie avec jusqu'à 150 étiquettes, y compris des attributs de convention OpenTelemetry sémantique et des étiquettes de pods et de nœuds Kubernetes. ProMQL gère l'agrégation au moment de la requête, de sorte que chaque métrique est publiée une fois par ressource plutôt qu'à plusieurs niveaux d'agrégation. Le module complémentaire met également en corrélation les métriques d'accélérateur de AWS Neuron et d' AWS Elastic Fabric Adapter avec les pods et conteneurs spécifiques qui les utilisent, offrant ainsi une visibilité qui n'est pas disponible uniquement à partir des sources métriques.

Pour activer OTel Container Insights sur un cluster Amazon EKS, installez la version complémentaire Amazon CloudWatch Observability EKS v6.0.1-eksbuild.1 ou une version ultérieure via la console Amazon EKS ou via l'infrastructure sous forme de code.

Pour plus d'informations sur la configuration de OTel Container Insights, consultezConfiguration de Container Insights.

Pour plus d'informations sur l'interrogation de ces métriques avec ProMQL, consultez. Requête ProMAL

Comparaison entre OTel Container Insights et Container Insights (amélioré)

Le tableau suivant résume les différences entre Container Insights (amélioré) et OTel Container Insights.

Fonctionnalité	Container Insights (amélioré)	OTel Informations sur les conteneurs
Noms des métriques	CloudWatch-format les métriques (par exemple,`pod_cpu_utilization`)	Natif open source (par exemple,`container_cpu_usage_seconds_total`)
Étiquettes par métrique	3 à 6 dimensions prédéfinies par métrique	Jusqu'à 150 étiquettes, y compris toutes les étiquettes des pods et des nœuds Kubernetes
Agrégation	Préagrégé à plusieurs niveaux (cluster, espace de noms, charge de travail, pod)	Métriques brutes par ressource ; agrégées au moment de la requête avec ProMQL
Langage de requête	CloudWatch API de métriques	ProMQL (compatible avec Prometheus)
Ingestion métrique	CloudWatch Logs au format EMF	Point de terminaison OTLP

Comment les métriques sont étiquetées

Chaque métrique collectée par OTel Container Insights comporte des étiquettes provenant de trois sources.

Libellés natifs des sources de télémétrie: Étiquettes issues de la source métrique d'origine (par exemple, cAdvisor fournit des étiquettes telles que podnamespace, etcontainer). Ils sont conservés sous forme d'attributs de point de données.
OpenTelemetry attributs de ressources: Le module complémentaire ajoute des attributs de ressources conformément aux conventions OpenTelemetry sémantiques pour Kubernetes, Host et Cloud, telles quek8s.pod.name,,, et. k8s.namespace.name k8s.node.name host.name cloud.region Ces attributs sont cohérents dans toutes les sources métriques.
Étiquettes des pods et des nœuds Kubernetes: Toutes les étiquettes de pod et de nœud découvertes à partir de l'API Kubernetes sont ajoutées sous forme d'attributs de ressource avec les préfixes et. k8s.pod.label k8s.node.label

Pour plus d'informations sur la façon d'interroger ces attributs à l'aide de ProMQL, consultez. Requête ProMAL

Métriques prises en charge

Le tableau suivant répertorie les sources et catégories de métriques collectées par OTel Container Insights.

Source de la métrique	Catégorie de la métrique	Conditions préalables
cViseur	Métriques de processeur	-
cViseur	Métrique de mémoire	-
cViseur	Métriques de réseau	-
cViseur	Métriques relatives aux disques et aux systèmes de fichiers	-
Exportateur de nœuds Prometheus	Métriques de processeur	-
Exportateur de nœuds Prometheus	Métrique de mémoire	-
Exportateur de nœuds Prometheus	Métriques de disque	-
Exportateur de nœuds Prometheus	Métriques du système de fichiers	-
Exportateur de nœuds Prometheus	Métriques de réseau	-
Exportateur de nœuds Prometheus	Métriques du système	-
Exportateur de nœuds Prometheus	VMStat métriques	-
Exportateur de nœuds Prometheus	Netstat et métriques des sockets	-
NVIDIA DCGM	Indicateurs de performance et d'utilisation du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM	Métriques de mémoire du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM	Indicateurs de puissance et de température du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM	Métriques de régulation du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM	Indicateurs d'erreur et de fiabilité du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM	NVLink Métriques du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
NVIDIA DCGM	Métriques informatives du GPU	Le plug-in pour appareil NVIDIA et le kit d'outils de conteneur NVIDIA doivent être installés.
AWS Moniteur Neuron	NeuronCore métriques	Le pilote Neuron et le plug-in du périphérique Neuron doivent être installés.
AWS Moniteur Neuron	NeuronDevice métriques	Le pilote Neuron et le plug-in du périphérique Neuron doivent être installés.
AWS Moniteur Neuron	Métriques du système neuronal	Le pilote Neuron et le plug-in du périphérique Neuron doivent être installés.
AWS Adaptateur en tissu élastique	Métriques EFA	Le plug-in pour appareil EFA doit être installé.
NVMe	NVMe Métriques SMART	-
Métriques de l'état de Kube	Pod, node, Deployment DaemonSet StatefulSet, ReplicaSet,, Job CronJob,, Service, Namespace PersistentVolume, métriques PersistentVolumeClaim	-
Serveur d'API Kubernetes	Serveur API et métriques etcd	-

Désactiver la double publication

À partir de la version v6.0.1-eksbuild.1 ou ultérieure du module complémentaire Amazon CloudWatch Observability EKS, le module complémentaire publie des métriques par le biais de Container Insights (ancienne version) et de Container Insights par défaut. OTel Si vous ne souhaitez utiliser que l'un d'entre eux, vous pouvez désactiver l'autre.

Désactiver OTel Container Insights

Pour arrêter de publier les métriques de OTel Container Insights et utiliser uniquement l'ancienne version de Container Insights, définissez la otelContainerInsights configuration sur Désactivée.

Utilisez la valeur de configuration suivante :


{"otelContainerInsights":{"enabled":false}}

Exécutez la commande suivante pour appliquer la configuration :


aws eks update-addon \
  --cluster-name CLUSTER_NAME \
  --addon-name amazon-cloudwatch-observability \
  --configuration-values '{"otelContainerInsights":{"enabled":false}}' \
  --region REGION

Désactiver Container Insights

Pour arrêter de publier les anciens indicateurs de Container Insights et utiliser uniquement OTel Container Insights, définissez la containerInsights configuration sur Désactivée.

Utilisez la valeur de configuration suivante :


{"containerInsights":{"enabled":false}}

Exécutez la commande suivante pour appliquer la configuration :


aws eks update-addon \
  --cluster-name CLUSTER_NAME \
  --addon-name amazon-cloudwatch-observability \
  --configuration-values '{"containerInsights":{"enabled":false}}' \
  --region REGION

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Container Insights avec observabilité améliorée pour Amazon EKS

Configuration de Container Insights