View a markdown version of this page

Suivez l'utilisation de la capacité des tâches informatiques - AWS Batch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Suivez l'utilisation de la capacité des tâches informatiques

AWS Batch fournit plusieurs opérations d'API que vous pouvez utiliser ensemble pour suivre l'utilisation de la capacité pour les tâches de calcul ECS, EKS et Fargate dans une file d'attente. Le flux de travail de surveillance dépend du type de politique de planification attachée à votre file d'attente de tâches.

Pour les files d'attente de tâches qui utilisent une politique de planification du premier entré, premier sorti (FIFO) :

  1. Vérifiez l'utilisation totale de la file d'attente (GetJobQueueSnapshot).

  2. Répertoriez les tâches par statut, par exemple RUNNABLE et RUNNING (ListJobs).

  3. Examinez n'importe quelle tâche (DescribeJobs).

Pour les files d'attente de tâches qui utilisent une politique de planification équitable (FSS) :

  1. Vérifiez l'utilisation totale de la file d'attente (GetJobQueueSnapshot).

  2. Afficher le taux d'utilisation par action (GetJobQueueSnapshot).

  3. Répertoriez les tâches par statut et par partage qui contribuent activement à leur utilisation, telles que RUNNABLE and RUNNING (ListJobs).

  4. Examinez n'importe quelle tâche (DescribeJobs).

Les sections suivantes décrivent chaque étape en détail.

Pour plus d'informations sur le suivi de l'utilisation de la capacité pour les tâches de service, consultezSuivez l'utilisation de la capacité des services.

Vérifier l'utilisation des files d'attente

Le queueUtilization champ de la GetJobQueueSnapshotréponse fournit une point-in-time vue de la capacité de calcul consommée par les tâches expédiées depuis une file d'attente. La capacité est mesurée en v CPUs pour les tâches de calcul.

Pour les files d'attente de travail qui utilisent une politique de planification équitable, la réponse inclut également une ventilation par action afin que vous puissiez voir comment la capacité est répartie entre les actions. Pour de plus amples informations, veuillez consulter Afficher le taux d'utilisation par action.

Afficher le taux d'utilisation des capacités (AWS CLI)

Utilisez la get-job-queue-snapshotcommande pour récupérer un instantané de l'utilisation de la capacité pour une file d'attente de tâches.

aws batch get-job-queue-snapshot \ --job-queue my-job-queue

La réponse varie en fonction de la politique de planification attachée à votre file d'attente de tâches. Choisissez l'onglet correspondant à votre type de politique de planification pour voir un exemple de réponse.

First-in, first-out (FIFO)

Voici un exemple de réponse pour une file de tâches FIFO exécutant des tâches de calcul. Comme une file d'attente FIFO n'utilise pas de politique de planification, la réponse n'inclut pas l'utilisation par partage.

{ "frontOfQueue": { "jobs": [], "lastUpdatedAt": 1700000000000 }, "queueUtilization": { "totalCapacityUsage": [ { "capacityUnit": "vCPU", "quantity": 96.0 } ], "lastUpdatedAt": 1700000000000 } }

Dans cet exemple, la file d'attente consomme un total de 96 V pour CPUs toutes les tâches distribuées.

Fair-share scheduling (FSS)

Voici un exemple de réponse pour une file d'attente de tâches équitable. L'queueUtilizationobjet contient un point-in-time instantané de la capacité totale consommée par toutes les tâches expédiées depuis la file d'attente, ainsi qu'une ventilation par partage.

{ "frontOfQueue": { "jobs": [], "lastUpdatedAt": 1700000000000 }, "queueUtilization": { "totalCapacityUsage": [ { "capacityUnit": "vCPU", "quantity": 192.0 } ], "fairshareUtilization": { "activeShareCount": 2, "topCapacityUtilization": [ { "shareIdentifier": "team-a", "capacityUsage": [ { "capacityUnit": "vCPU", "quantity": 128.0 } ] }, { "shareIdentifier": "team-b", "capacityUsage": [ { "capacityUnit": "vCPU", "quantity": 64.0 } ] } ] }, "lastUpdatedAt": 1700000000000 } }

Dans cet exemple, le totalCapacityUsage champ indique que la file d'attente consomme un total de 192 CPUs v. L'fairshareUtilizationobjet affiche la répartition par action. Le partage team-a consomme 128 V CPUs et le partage team-b 64 CPUs V.

Afficher le taux d'utilisation par action

Pour les files d'attente de travail soumises à une politique de planification équitable, la queueUtilization réponse de GetJobQueueSnapshot inclut un fairshareUtilization objet avec un topCapacityUtilization tableau répertoriant les principales actions actives par consommation.

Ces informations vous aident à :

  • Identifiez les actions qui consomment le plus de ressources.

  • Vérifiez que la planification du partage équitable distribue les ressources comme prévu.

  • Détectez les actions susceptibles de saturer ou de sous-utiliser leur allocation.

  • Déterminez s'il convient d'ajuster la pondération des actions dans votre politique de planification.

Pour plus d'informations sur les politiques de planification de partage équitable, consultez. Politiques de planification équitables

Répertoriez les tâches de calcul par statut et partagez-les

Après avoir identifié la file d'attente globale et l'utilisation par partage, utilisez l'opération d'ListJobsAPI pour rechercher les tâches de calcul qui contribuent activement à l'utilisation. Vous pouvez filtrer par statut de tâche pour voir les tâches qui sont RUNNING ou se trouvent dans un autre état. RUNNABLE Pour les files d'attente soumises à une politique de planification équitable, vous pouvez également filtrer par identifiant de partage afin de limiter les résultats à un partage spécifique.

Note

Le SHARE_IDENTIFIER filtre est le seul filtre qui peut être combiné avec le jobStatus paramètre. Lorsque vous utilisez d'autres filtres, le jobStatus paramètre est ignoré.

Répertorier les tâches informatiques (AWS CLI)

Utilisez la commande list-jobs avec le --job-status paramètre pour filtrer par statut.

Consultez les tâches de calcul en cours dans votre file d'attente :

aws batch list-jobs \ --job-queue my-job-queue \ --job-status RUNNING

Afficher les tâches de calcul en attente d'expédition :

aws batch list-jobs \ --job-queue my-job-queue \ --job-status RUNNABLE

Pour les files d'attente soumises à une politique de planification équitable, utilisez le --filters paramètre with pour SHARE_IDENTIFIER répertorier les tâches correspondant à un partage spécifique. Cela est utile lorsque vous identifiez une part dont la consommation de capacité est élevée et que vous souhaitez savoir quels emplois sont responsables.

Répertoriez uniquement les tâches de RUNNING calcul pour un partage à partir d'une file d'attente de partage équitable :

aws batch list-jobs \ --job-queue my-job-queue \ --job-status RUNNING \ --filters name=SHARE_IDENTIFIER,values="team-a"

Voici un exemple de réponse pour répertorier les tâches de calcul en cours d'exécution.

{ "jobSummaryList": [ { "jobArn": "arn:aws:batch:us-east-1:123456789012:job/b5e7d839-9ff9-5d76-9f3b-0b6f9g5c8e4f", "jobId": "b5e7d839-9ff9-5d76-9f3b-0b6f9g5c8e4f", "jobName": "my-data-processing-job", "status": "RUNNING", "shareIdentifier": "team-a", "createdAt": 1700000000000, "startedAt": 1700000120000, "capacityUsage": [ { "capacityUnit": "vCPU", "quantity": 4.0 } ], "container": { "exitCode": null }, "jobDefinition": "arn:aws:batch:us-east-1:123456789012:job-definition/my-job-def:1" } ] }

Examiner une tâche de calcul spécifique

Après avoir identifié une tâche de calcul qui vous intéresse, utilisez l'DescribeJobsopération pour obtenir des informations complètes sur la tâche, notamment son statut actuel, les détails du conteneur et la configuration des ressources.

Afficher des informations détaillées sur une tâche de calcul spécifique :

aws batch describe-jobs \ --jobs b5e7d839-9ff9-5d76-9f3b-0b6f9g5c8e4f

Cette commande renvoie des informations complètes sur la tâche, notamment :

  • Job ARN et statut actuel

  • Configuration du conteneur et besoins en ressources (v CPUs et mémoire)

  • Définition du job et détails de l'environnement informatique

  • Planification de la priorité et configuration des nouvelles tentatives

  • Informations détaillées sur les tentatives avec heures de début et d'arrêt

  • Informations sur les flux de journaux pour accéder aux journaux des conteneurs