Primeros pasos en las operaciones unificadas: incorpore alarmas críticas para una gestión rápida de los incidentes

Para poder notificarle rápidamente los incidentes críticos, complete los siguientes pasos para incorporar sus alarmas a la detección y respuesta a AWS incidentes

Defina y configure sus alarmas críticas para una gestión rápida de los incidentes. Para obtener información detallada, consulte Definir y configurar las alarmas en la detección y respuesta a incidentes en la Guía del usuario de detección y respuesta a incidentes.
1. Para conocer los pasos para configurar las alarmas con Amazon CloudWatch, consulta Definir y configurar alarmas en Detección y respuesta a incidentes en la Guía del usuario de detección y respuesta a incidentes. Para obtener AWS recomendaciones sobre los tipos de alarmas críticas para varios tipos Servicios de AWS, consulte Detección y respuesta a incidentes (IDR). Póngase en contacto con su equipo de operaciones AWS unificadas si AWS desea automatizar la creación de AWS alarmas críticas para sus AWS recursos etiquetados.
2. Para redirigir o ingerir alarmas críticas de herramientas de APM de terceros con EventBridge integración directa con Amazon, como DataDog, etc. NewRelic, consulte Ingesta de alarmas de APM que tienen integración directa con Amazon EventBridge en la Guía del usuario de detección y respuesta a AWS incidentes. Debe implementar un conjunto de AWS recursos (AWS Lambda y reglas del bus de EventBridge eventos de Amazon) para transformar y redirigir su alarma (evento) a la detección y respuesta a AWS incidentes. Su equipo de operaciones AWS unificadas puede ayudarlo a proporcionar la CloudFormation plantilla para instalar estos recursos.
3. Redirige o ingiere alarmas críticas desde tu herramienta de monitorización personalizada a través de una herramienta de APM de terceros que no tenga una integración directa con Amazon. EventBridge Para obtener más información, consulta Cómo usar webhooks para ingerir alarmas de APM sin una integración directa con Amazon EventBridge en la Guía del usuario de detección y respuesta a AWS incidentes. Debe implementar un conjunto de AWS recursos ( AWS Lambda funciones de API Gateway y reglas de bus de EventBridge eventos de Amazon) para transformar y redirigir su alarma (evento) a AWS Incident Detection and Response. Su equipo de operaciones AWS unificadas puede ayudarlo a proporcionar la CloudFormation plantilla para instalar estos recursos.
Proporcione los detalles de la arquitectura de la carga de trabajo, la información del punto de contacto y la información preliminar sobre las acciones de mitigación en caso de alarmas críticas. Para ello, siga los pasos que se describen a continuación:
1. Descargue y complete el cuestionario de incorporación de cargas de trabajo de detección y respuesta a AWS incidentes para cada carga de trabajo o aplicación crítica y el cuestionario de incorporación de alarmas relacionado con cada carga de trabajo única.
  
  La información de estos cuestionarios ayuda al AWS equipo a elaborar un manual de corrección de incidentes. Este manual permite tomar las medidas adecuadas para solucionar y corregir rápidamente las alarmas críticas antes de que provoquen un tiempo de inactividad empresarial. Para ver ejemplos y ejemplos de información, consulte los cuestionarios sobre la incorporación de la carga de trabajo y la ingesta de alarmas en la sección Detección y respuesta a incidentes. AWS
Proporcione acceso para incorporar sus alarmas críticas a la detección y respuesta a AWS incidentes
1. Implemente la función AWSServiceRoleForHealth_EventProcessor vinculada al servicio (SLR) en la Cuenta de AWS gestión de la carga de trabajo crítica para que el equipo de gestión de AWS incidentes la supervise. Para obtener más información, consulte Proporcionar acceso para la ingesta de alertas a la detección y respuesta a AWS incidentes.
  
  nota
  Para ayudarle a incorporar una cámara réflex de gran tamaño Cuentas de AWS, AWS podemos proporcionarle un AWS Command Line Interface script que agilice el aprovisionamiento de esta cámara réflex.
2. (Opcional) Si tus alarmas están en Amazon CloudWatch, asegúrate de que el AWS Identity and Access Management usuario o rol que se utiliza para las pruebas de alarmas (antes de la puesta en marcha) tenga el permiso de cloudwatch:SetAlarmState IAM en el Cuenta de AWS que se ejecuta la carga de trabajo crítica. Esto es necesario para probar las alarmas (el día del partido) tras la incorporación. Para obtener más información, consulte Probar las cargas de trabajo integradas en AWS Detección y respuesta a incidentes.
Cree un AWS Support caso para suscribir una carga de trabajo para una gestión rápida de los incidentes. Tenga en cuenta que Cuenta de AWS está habilitada automáticamente para la gestión rápida de incidentes entrantes, lo que significa que puede enviar un caso a la cola de detección y respuesta a incidentes de Unified Operations a través de la consola del Support Center AWS Command Line Interface, el o el AWS SDK para tomar medidas rápidas. AWS Para supervisar y crear incidentes de forma proactiva con un AWS Support caso saliente, cree un AWS Support caso para su carga de trabajo crítica. Para ello, siga los pasos que se describen a continuación:
1. Inicie sesión en AWS Support Center Console, seleccione Crear caso y, a continuación, seleccione Soporte técnico.
2. En Servicio, selecciona Detección y respuesta a incidentes.
3. En Categoría, seleccione Incorporar una nueva carga de trabajo.
4. En Gravedad, selecciona Guía general.
5. Adjunte los cuestionarios de carga de trabajo y alarma que completó en el paso anterior.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Requisitos previos

Solicite una respuesta a un incidente en 5 minutos

Primeros pasos en las operaciones unificadas: incorpore alarmas críticas para una gestión rápida de los incidentes

nota