

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Développez des guides et des plans de réponse pour répondre à un incident dans le cadre de la détection et de la réponse aux incidents
<a name="idr-workloads-dev-runbook"></a>

AWS Incident Detection and Response utilise les informations capturées lors de l'intégration de votre CLI IDR pour développer des runbooks destinés à la gestion des incidents affectant vos charges de travail. Runbooks documente les étapes suivies par les gestionnaires d'incidents lorsqu'ils répondent à un incident. Un plan de réponse est mappé à au moins une de vos charges de travail. L'équipe de gestion des incidents crée ces modèles à partir des informations que vous avez fournies lors de l'[intégration de la charge de travail](getting-started-idr.md#workload-onboarding).

**Principaux résultats :**
+ Finalisation de la définition de votre charge de travail sur AWS Incident Detection and Response.
+ Réalisation des alarmes et des livrets d'exécution sur AWS Incident Detection and Response.

Vous pouvez également télécharger un exemple de manuel AWS Incident Detection and Response Runbook : [aws-idr-runbook-example.zip](samples/aws-idr-runbook-example.zip).

## Exemple de runbook
<a name="idr-workloads-runbook-example"></a>

**Example Exemple de runbook**  
**Description**  
Ce document est destiné à [CustomerName] - [WorkloadName].
**Étape : Priorité**  
**Actions prioritaires**

1. Envoyez la première correspondance concernant le Support dossier au client comme indiqué ci-dessous.

```
Hello,

This is <<Engineer's name>> from AWS Incident Detection and Response. An alarm has triggered for your workload <<Application_Name>>. I am currently investigating and will update you in a few minutes once I have finished initial investigation.

Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
```
**Étape : Informations**  
**Plans d'engagement**
Cette section décrit les plans d'engagement applicables à ce runbook et ne contient que les coordonnées. Les plans d'engagement seront référencés dans les **plans de communication** étape par étape.  
+ **Engagement initial**

  L'équipe de détection et de réponse aux incidents d'AWS ajoute les adresses des parties prenantes du client ci-dessous au Support dossier. AWS les parties prenantes concernent les parties prenantes supplémentaires qui pourraient avoir besoin d'être informées de tout problème.
  + *Parties prenantes du client* : customeremail1 ; customeremail2 ; mobile1
  + *AWS Parties prenantes* : aws-idr-oncall@amazon.com ; tam-team-email ; etc.
  + *Contacts à usage unique* : [Il s'agit de contacts par e-mail inclus uniquement dans la première communication. Supprimez ces contacts après la fin de la première communication. Il peut s'agir d'adresses e-mail de pagination des clients, telles que celles de pager-duty, qui ne doivent pas être paginées pour chaque correspondance. Ajoutez explicitement des instructions dans la section « Priorité », « Plans de communication », sur la façon de les utiliser uniquement si *les contacts à usage unique* sont disponibles.]
+ **Configuration des appels en cas d'incident**

  Indiquez si le client a besoin d'AWS Incident Detection and Response pour créer un pont, s'il utilise un pont statique ou s'il fournira un pont lors de l'ouverture d'un incident.

  (Choisissez une option en fonction des préférences du client)
  + AWS Incident Detection and Response crée un Amazon Chime/Zoom Bridge
  + Pont statique fourni par le client
    + Numéro de conférence : < Insert Conference number >
  + Le client fournit les détails du pont pour chaque incident en répondant aux communications envoyées par l'équipe de détection et de réponse aux incidents d'AWS.
  + Autre - Spécifiez les détails.
+ **Escalade d'engagement**

  AWS Incident Detection and Response contactera les contacts suivants lorsque les contacts du plan d'**engagement initial** ne répondent pas aux incidents.

  Pour chaque contact d'escalade, indiquez s'il doit être ajouté au Support dossier, téléphoné ou les deux.
  + Assurez-vous d'avoir appelé le contact d'engagement initial, le cas échéant, avant de passer à l'escalade.
  + *Premier contact d'escalade* : [escalation EmailAddress \#1]/[PhoneNumber] - Attendez XX minutes avant de passer à ce contact.
    + [Ajouter un contact au cas/téléphone] ce contact.
  + *Deuxième contact d'escalade* : [escalation EmailAddress \#2]/[PhoneNumber] - Attendez XX minutes avant de passer à ce contact.
    + [Ajouter un contact au cas/téléphone] ce contact.
  + etc.
**Plans de communication**  
Cette section décrit comment les ingénieurs de gestion des incidents communiquent avec les parties prenantes désignées en dehors des canaux d'appel et de communication relatifs à l'incident.  
+ **Plan de communication d'impact**

  Ce plan est lancé lorsque AWS Incident Detection and Response a déterminé, à l'issue de l'étape **Triage**, qu'une alerte indique un impact potentiel pour un client.

  AWS Incident Detection and Response demandera au client de rejoindre le pont prédéterminé, comme indiqué dans **Plans d'engagement - Configuration des appels en cas d'incident**.

  (Choisissez-en un selon que les *contacts à usage unique* sont disponibles ou non.)

  1. Assurez-vous que *les parties prenantes du client* sont parties prenantes dès les **plans d'engagement : l'engagement initial** est ajouté au dossier CC.

  OU

  1. Assurez-vous que *les parties prenantes du client* et *les contacts ponctuels* **figurent dans les plans d'engagement : l'engagement initial** est ajouté au dossier CC.

  1. Envoyez la notification d'engagement au client selon le modèle suivant :

     (Choisissez une option)

     *Modèle d'impact - Amazon Chime Bridge*

     ```
     The following alarm has engaged AWS Incident Detection and Response to an Incident bridge:
         Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025, 3:30 PM UTC>
     Please join the Amazon Chime Bridge below so we can start the steps outlined in your Runbook:
         Amazon Chime Meeting ID: <insert_Meeting_ID_here>
         Link to Amazon Chime Bridge: <insert_Link_here>
         International dial-in numbers: https://chime.aws/dialinnumbers/
     ```

     *Modèle d'impact - Pont fourni par le client*

     ```
     The following alarm has engaged AWS Incident Detection and Response:
         Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025 3:30 PM UTC>
     Please respond with your internal bridge details so we can join and start the steps outlined in your Runbook.
     ```

     *Modèle d'impact - Customer Static Bridge*

     ```
     The following alarm has engaged AWS Incident Detection and Response to an Incident bridge:
         Alarm Identifier - <insert CloudWatch Alarm ARN or APM Response Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025, 3:30 PM UTC>
     Please join the Bridge below so we can start the steps outlined in your Runbook:
         Conference Number: <insert_conference_number>
         Conference URL: <insert_bridge_URL>
     ```

  1. Configurez le dossier sur En attente d'une action du client.

  1. SUPPRIMEZ les *contacts à usage unique* du dossier après avoir envoyé la communication d'impact ci-dessus. (Si les *contacts à usage unique* sont disponibles.)

  1. Suivez le plan **d'escalade de l'engagement** tel que mentionné ci-dessus.

  1. Si le client ne répond pas dans les 30 minutes, désactivez et continuez à surveiller jusqu'à ce que l'alarme se rétablisse.
+ **Plan de communication sans impact**

  Ce plan est lancé lorsqu'une alarme se rétablit avant que la détection et la réponse aux incidents n'aient terminé le **triage** initial.

  1. Avant d'envoyer la notification sans impact, vérifiez, puis supprimez les contacts clients and/or ajoutés au Support Case CC en fonction des contacts répertoriés dans les **plans d'engagement - Plan d'engagement initial**.

     [« NE PAS ajouter *de contacts uniques*. »] (Applicable si *les contacts à usage unique* sont disponibles.)

  1. Envoyez une notification de non-engagement au client en vous basant sur le modèle ci-dessous :

     *Modèle sans impact*

     ```
     AWS Incident Detection and Response received an alarm that has recovered for your workload.
         Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025, 3:30 PM UTC>
         Alarm End Time - <Example: 1 January 2025, 3:35 PM UTC>
     This may indicate a brief customer impact that is currently not ongoing.
     If there is an ongoing impact to your workload, please let us know and we will engage to assist.
     ```

  1. Inscrivez le dossier dans **Pending Customer Action**.

  1. Si le client ne répond pas dans les 30 minutes, résolvez le problème.
**Présentation de l'architecture des applications**  
Cette section fournit une vue d'ensemble de l' application/workload architecture destinée à sensibiliser les ingénieurs de gestion des incidents et les ingénieurs des opérations.  
+ **AWS Comptes et régions proposant des services clés** : liste des AWS comptes dont les régions prennent en charge cette application. Aide les ingénieurs à évaluer l'infrastructure sous-jacente supportant l'application.
  + 123456789012
    + US-EAST-1 - un bref descriptif, le cas échéant
      + Amazon EC2 : brève description, le cas échéant
      + DynamoDB : brève description, le cas échéant
      + etc.
    + US-WEST-1 - un bref descriptif, le cas échéant
      + etc.
  + un autre compte
    + etc.