Terminologie des rapports d'incidents

Les termes suivants sont utilisés dans les rapports d'incidents relatifs aux CloudWatch enquêtes :

Faits dérivés de l'IA: Une information ou une observation que le système d'IA considère comme objectivement vraie ou hautement probable sur la base des données disponibles, de la télémétrie, des journaux et des modèles historiques au sein des services. AWS Ces faits sont dérivés d'analyses algorithmiques et de modèles d'apprentissage automatique, et bien qu'ils soient considérés comme fiables par le système, ils doivent être soumis à une vérification humaine, en particulier dans les contextes décisionnels critiques. Les faits dérivés de l'IA peuvent inclure des corrélations entre des événements, des détections d'anomalies ou des inférences sur le comportement du système qui peuvent ne pas être immédiatement apparentes pour les opérateurs humains.
Actions correctives: Mesures spécifiques et réalisables recommandées par les CloudWatch enquêtes pour s'attaquer à la cause première d'un incident et empêcher qu'il ne se reproduise, sur la base des AWS meilleures pratiques et du contexte spécifique des ressources concernées.
Catégories de faits: Regroupements structurés d'informations relatives aux incidents, telles que les mesures d'impact, les détails de détection et les mesures d'atténuation, utilisés pour organiser les données en vue de la génération de rapports.
Évaluation d'impact: Évaluation quantitative et qualitative des effets d'un incident sur les performances du système, l'expérience utilisateur et les opérations commerciales, dérivée de CloudWatch mesures et d'autres données de AWS service ajoutées à l'enquête.
Génération de rapports d'incidents: Processus automatisé qui crée une documentation complète d'un incident opérationnel, y compris son calendrier, son impact, sa cause première et les étapes de résolution, sur la base des données collectées lors d'une enquête d' CloudWatch investigation.
Fil d'enquête: Affichage chronologique des observations acceptées, des hypothèses et des notes ajoutées par les utilisateurs dans le cadre d'une CloudWatch enquête, qui constitue le principal enregistrement des progrès et des conclusions de l'enquête.
Leçons apprises: Informations générées automatiquement et opportunités d'amélioration identifiées dans le cadre du processus d'enquête sur les incidents, dans le but d'améliorer la fiabilité du système, l'efficacité opérationnelle et les capacités de réponse aux incidents dans l'ensemble de l'organisation.
Évaluation du rapport: Une évaluation automatisée du rapport d'incident généré, identifiant les éventuelles lacunes dans les données ou les domaines nécessitant des informations supplémentaires pour améliorer l'exhaustivité et la qualité du rapport.
Analyse des causes profondes: Un processus systématique visant à identifier la raison fondamentale d'un problème opérationnel, en tirant parti des CloudWatch enquêtes, des hypothèses basées sur l'IA et des corrélations entre plusieurs services. AWS
onglet Suggestions: Fonctionnalité CloudWatch des enquêtes qui présente des observations et des hypothèses générées par l'IA concernant des causes potentielles ou des problèmes connexes, sur la base de l'analyse de la télémétrie et des journaux du système.
Chronologie des événements: Séquence chronologique des événements importants survenus au cours d'un incident, automatiquement extraite CloudWatch des journaux, des métriques et d'autres données de AWS service afin de fournir une vue d'ensemble claire de la progression de l'incident.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Comprendre les faits dérivés de l'IA dans les rapports d'incidents

Générer un rapport à partir d'une enquête