

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Container Insights avec OpenTelemetry métriques pour Amazon EKS
<a name="container-insights-otel-metrics"></a>

**Version préliminaire**  
Container Insights avec OpenTelemetry métriques fournit une visibilité sur l'état de fonctionnement de votre infrastructure de cluster Amazon EKS. Il est disponible en avant-première publique sans frais supplémentaires aux États-Unis Est (Virginie du Nord), à l'Ouest des États-Unis (Oregon), en Europe (Irlande), en Asie-Pacifique (Singapour) et en Asie-Pacifique (Sydney).

Le module complémentaire Amazon CloudWatch Observability EKS collecte des métriques open source à partir de vos clusters Amazon EKS et les envoie à CloudWatch l'aide du OpenTelemetry protocole (OTLP) avec une granularité de 30 secondes. Ces métriques utilisent des noms de métriques issus de leurs sources d'origine, notamment cAdvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics et Neuron Monitor. AWS Vous pouvez interroger ces métriques à l'aide de ProMQL dans CloudWatch Query Studio ou via l'API de requête compatible Prometheus.

Chaque métrique est automatiquement enrichie avec jusqu'à 150 étiquettes, y compris des attributs de convention OpenTelemetry sémantique et des étiquettes de pods et de nœuds Kubernetes. ProMQL gère l'agrégation au moment de la requête, de sorte que chaque métrique est publiée une fois par ressource plutôt qu'à plusieurs niveaux d'agrégation. Le module complémentaire met également en corrélation les métriques d'accélérateur de AWS Neuron et d' AWS Elastic Fabric Adapter avec les pods et conteneurs spécifiques qui les utilisent, offrant ainsi une visibilité qui n'est pas disponible uniquement à partir des sources métriques.

Pour activer OTel Container Insights sur un cluster Amazon EKS, installez la version complémentaire Amazon CloudWatch Observability EKS `v6.0.1-eksbuild.1` ou une version ultérieure via la console Amazon EKS ou via l'infrastructure sous forme de code.

Pour plus d'informations sur la configuration de OTel Container Insights, consultez[Configuration de Container Insights](deploy-container-insights.md).

Pour plus d'informations sur l'interrogation de ces métriques avec ProMQL, consultez. [Requête ProMAL](CloudWatch-PromQL-Querying.md)

## Comparaison entre OTel Container Insights et Container Insights (amélioré)
<a name="container-insights-otel-comparison"></a>

Le tableau suivant résume les différences entre Container Insights (amélioré) et OTel Container Insights.


| Fonctionnalité | Container Insights (amélioré) | OTel Informations sur les conteneurs | 
| --- | --- | --- | 
| Noms des métriques | CloudWatch-format les métriques (par exemple,pod\_cpu\_utilization) | Natif open source (par exemple,container\_cpu\_usage\_seconds\_total) | 
| Étiquettes par métrique | 3 à 6 dimensions prédéfinies par métrique | Jusqu'à 150 étiquettes, y compris toutes les étiquettes des pods et des nœuds Kubernetes | 
| Agrégation | Préagrégé à plusieurs niveaux (cluster, espace de noms, charge de travail, pod) | Métriques brutes par ressource ; agrégées au moment de la requête avec ProMQL | 
| Langage de requête | CloudWatch API de métriques | ProMQL (compatible avec Prometheus) | 
| Ingestion métrique | CloudWatch Logs au format EMF | Point de terminaison OTLP | 

## Comment les métriques sont étiquetées
<a name="container-insights-otel-labels"></a>

Chaque métrique collectée par OTel Container Insights comporte des étiquettes provenant de trois sources.

Libellés natifs des sources de télémétrie  
Étiquettes issues de la source métrique d'origine (par exemple, cAdvisor fournit des étiquettes telles que `pod``namespace`, et`container`). Ils sont conservés sous forme d'attributs de point de données.

OpenTelemetry attributs de ressources  
Le module complémentaire ajoute des attributs de ressources conformément aux conventions OpenTelemetry sémantiques pour [Kubernetes](https://opentelemetry.io/docs/specs/semconv/resource/k8s/), [Host](https://opentelemetry.io/docs/specs/semconv/resource/host/) et [Cloud](https://opentelemetry.io/docs/specs/semconv/resource/cloud/), telles que`k8s.pod.name`,,, et. `k8s.namespace.name` `k8s.node.name` `host.name` `cloud.region` Ces attributs sont cohérents dans toutes les sources métriques.

Étiquettes des pods et des nœuds Kubernetes  
Toutes les étiquettes de pod et de nœud découvertes à partir de l'API Kubernetes sont ajoutées sous forme d'attributs de ressource avec les préfixes et. `k8s.pod.label` `k8s.node.label`

Pour plus d'informations sur la façon d'interroger ces attributs à l'aide de ProMQL, consultez. [Requête ProMAL](CloudWatch-PromQL-Querying.md)

## Métriques prises en charge
<a name="container-insights-otel-supported-metrics"></a>

Le tableau suivant répertorie les sources et catégories de métriques collectées par OTel Container Insights.


| Source de la métrique | Catégorie de la métrique | Conditions préalables | 
| --- | --- | --- | 
| cViseur | Métriques de processeur | - | 
| cViseur | Métrique de mémoire | - | 
| cViseur | Métriques de réseau | - | 
| cViseur | Métriques relatives aux disques et aux systèmes de fichiers | - | 
| Exportateur de nœuds Prometheus | Métriques de processeur | - | 
| Exportateur de nœuds Prometheus | Métrique de mémoire | - | 
| Exportateur de nœuds Prometheus | Métriques de disque | - | 
| Exportateur de nœuds Prometheus | Métriques du système de fichiers | - | 
| Exportateur de nœuds Prometheus | Métriques de réseau | - | 
| Exportateur de nœuds Prometheus | Métriques du système | - | 
| Exportateur de nœuds Prometheus | VMStat métriques | - | 
| Exportateur de nœuds Prometheus | Netstat et métriques des sockets | - | 
| NVIDIA DCGM | Indicateurs de performance et d'utilisation du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| NVIDIA DCGM | Métriques de mémoire du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| NVIDIA DCGM | Indicateurs de puissance et de température du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| NVIDIA DCGM | Métriques de régulation du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| NVIDIA DCGM | Indicateurs d'erreur et de fiabilité du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| NVIDIA DCGM |  NVLink Métriques du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| NVIDIA DCGM | Métriques informatives du GPU | [Le plug-in pour appareil NVIDIA](https://github.com/NVIDIA/k8s-device-plugin) [et le kit d'outils de conteneur NVIDIA](https://github.com/NVIDIA/nvidia-container-toolkit) doivent être installés. | 
| AWS Moniteur Neuron | NeuronCore métriques | [Le pilote Neuron](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/general/setup/neuron-setup/pytorch/neuronx/ubuntu/torch-neuronx-ubuntu22.html) et le [plug-in du périphérique Neuron](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) doivent être installés. | 
| AWS Moniteur Neuron | NeuronDevice métriques | [Le pilote Neuron](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/general/setup/neuron-setup/pytorch/neuronx/ubuntu/torch-neuronx-ubuntu22.html) et le [plug-in du périphérique Neuron](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) doivent être installés. | 
| AWS Moniteur Neuron | Métriques du système neuronal | [Le pilote Neuron](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/general/setup/neuron-setup/pytorch/neuronx/ubuntu/torch-neuronx-ubuntu22.html) et le [plug-in du périphérique Neuron](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) doivent être installés. | 
| AWS Adaptateur en tissu élastique | Métriques EFA | [Le plug-in pour appareil EFA](https://github.com/aws/eks-charts/tree/master/stable/aws-efa-k8s-device-plugin) doit être installé. | 
| NVMe | NVMe Métriques SMART | - | 
| Métriques de l'état de Kube | Pod, node, Deployment DaemonSet StatefulSet, ReplicaSet,, Job CronJob,, Service, Namespace PersistentVolume, métriques PersistentVolumeClaim  | - | 
| Serveur d'API Kubernetes | Serveur API et métriques etcd | - | 

## Désactiver la double publication
<a name="container-insights-otel-disable-dual-publish"></a>

À partir de la version v6.0.1-eksbuild.1 ou ultérieure du module complémentaire Amazon CloudWatch Observability EKS, le module complémentaire publie des métriques par le biais de Container Insights (ancienne version) et de Container Insights par défaut. OTel Si vous ne souhaitez utiliser que l'un d'entre eux, vous pouvez désactiver l'autre.

### Désactiver OTel Container Insights
<a name="container-insights-otel-disable-otel"></a>

Pour arrêter de publier les métriques de OTel Container Insights et utiliser uniquement l'ancienne version de Container Insights, définissez la `otelContainerInsights` configuration sur Désactivée.

Utilisez la valeur de configuration suivante :

```
{"otelContainerInsights":{"enabled":false}}
```

Exécutez la commande suivante pour appliquer la configuration :

```
aws eks update-addon \
  --cluster-name {{CLUSTER_NAME}} \
  --addon-name amazon-cloudwatch-observability \
  --configuration-values '{"otelContainerInsights":{"enabled":false}}' \
  --region {{REGION}}
```

### Désactiver Container Insights
<a name="container-insights-otel-disable-legacy"></a>

Pour arrêter de publier les anciens indicateurs de Container Insights et utiliser uniquement OTel Container Insights, définissez la `containerInsights` configuration sur Désactivée.

Utilisez la valeur de configuration suivante :

```
{"containerInsights":{"enabled":false}}
```

Exécutez la commande suivante pour appliquer la configuration :

```
aws eks update-addon \
  --cluster-name {{CLUSTER_NAME}} \
  --addon-name amazon-cloudwatch-observability \
  --configuration-values '{"containerInsights":{"enabled":false}}' \
  --region {{REGION}}
```