Terminologie des rapports d'incidents - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Terminologie des rapports d'incidents

Les termes suivants sont utilisés dans les rapports d'incidents relatifs aux CloudWatch enquêtes :

Faits dérivés de l'IA

Une information ou une observation que le système d'IA considère comme objectivement vraie ou hautement probable sur la base des données disponibles, de la télémétrie, des journaux et des modèles historiques au sein des services. AWS Ces faits sont dérivés d'analyses algorithmiques et de modèles d'apprentissage automatique, et bien qu'ils soient considérés comme fiables par le système, ils doivent être soumis à une vérification humaine, en particulier dans les contextes décisionnels critiques. Les faits dérivés de l'IA peuvent inclure des corrélations entre des événements, des détections d'anomalies ou des inférences sur le comportement du système qui peuvent ne pas être immédiatement apparentes pour les opérateurs humains.

Actions correctives

Mesures spécifiques et réalisables recommandées par les CloudWatch enquêtes pour s'attaquer à la cause première d'un incident et empêcher qu'il ne se reproduise, sur la base des AWS meilleures pratiques et du contexte spécifique des ressources concernées.

Catégories de faits

Regroupements structurés d'informations relatives aux incidents, telles que les mesures d'impact, les détails de détection et les mesures d'atténuation, utilisés pour organiser les données en vue de la génération de rapports.

Évaluation d'impact

Évaluation quantitative et qualitative des effets d'un incident sur les performances du système, l'expérience utilisateur et les opérations commerciales, dérivée de CloudWatch mesures et d'autres données de AWS service ajoutées à l'enquête.

Génération de rapports d'incidents

Processus automatisé qui crée une documentation complète d'un incident opérationnel, y compris son calendrier, son impact, sa cause première et les étapes de résolution, sur la base des données collectées lors d'une enquête d' CloudWatch investigation.

Fil d'enquête

Affichage chronologique des observations acceptées, des hypothèses et des notes ajoutées par les utilisateurs dans le cadre d'une CloudWatch enquête, qui constitue le principal enregistrement des progrès et des conclusions de l'enquête.

Leçons apprises

Informations générées automatiquement et opportunités d'amélioration identifiées dans le cadre du processus d'enquête sur les incidents, dans le but d'améliorer la fiabilité du système, l'efficacité opérationnelle et les capacités de réponse aux incidents dans l'ensemble de l'organisation.

Évaluation du rapport

Une évaluation automatisée du rapport d'incident généré, identifiant les éventuelles lacunes dans les données ou les domaines nécessitant des informations supplémentaires pour améliorer l'exhaustivité et la qualité du rapport.

Analyse des causes profondes

Un processus systématique visant à identifier la raison fondamentale d'un problème opérationnel, en tirant parti des CloudWatch enquêtes, des hypothèses basées sur l'IA et des corrélations entre plusieurs services. AWS

onglet Suggestions

Fonctionnalité CloudWatch des enquêtes qui présente des observations et des hypothèses générées par l'IA concernant des causes potentielles ou des problèmes connexes, sur la base de l'analyse de la télémétrie et des journaux du système.

Chronologie des événements

Séquence chronologique des événements importants survenus au cours d'un incident, automatiquement extraite CloudWatch des journaux, des métriques et d'autres données de AWS service afin de fournir une vue d'ensemble claire de la progression de l'incident.