

# Supervisión de AWS Glue con métricas de Amazon CloudWatch
<a name="monitoring-awsglue-with-cloudwatch-metrics"></a>

Puede proporcionar perfiles y supervisar las operaciones de AWS Glue con el generador de trabajos de AWS Glue. Recopila y procesa los datos sin procesar de AWS Glue para convertirlos en métricas legibles y casi en tiempo real en Amazon CloudWatch. Estas estadísticas se retienen y agregan en CloudWatch, de forma que pueda acceder a información histórica para obtener una mejor perspectiva sobre el rendimiento de su aplicación.

**nota**  
 Puede incurrir en cargos adicionales cuando habilita las métricas de trabajos y se crean métricas personalizadas de CloudWatch. Para obtener más información, consulte los [ precios de Amazon CloudWatch ](https://aws.amazon.com/cloudwatch/pricing/). 

## Información general de métricas de AWS Glue
<a name="metrics-overview"></a>

Cuando usted interactúa con AWS Glue, este último envía métricas a CloudWatch. Puede ver estas métricas en la consola de AWS Glue (el método preferido), el panel de la consola de CloudWatch o AWS Command Line Interface (AWS CLI). 

**Para consultar las métricas mediante el panel de la consola de AWS Glue**

Puede ver gráficos resumidos o detallados de métricas para un trabajo, o bien gráficos detallados para una ejecución de trabajo. 

1. Inicie sesión en Consola de administración de AWS y abra la consola de AWS Glue en [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. En el panel de navegación, seleccione **Monitoreo de ejecución de trabajos**.

1. En **Ejecuciones de trabajos**, elija **Acciones** para detener un trabajo que se ejecute actualmente, ver un trabajo o rebobinar el marcador del trabajo.

1. Seleccione un trabajo y, a continuación, elija **Ver detalles de la ejecución** para ver información adicional sobre la ejecución del trabajo.

**Para ver las métricas a través del panel de consola de CloudWatch**

Las métricas se agrupan en primer lugar por el espacio de nombres de servicio y, a continuación, por las diversas combinaciones de dimensiones dentro de cada espacio de nombres.

1. Abra la consola de CloudWatch en [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/).

1. En el panel de navegación, seleccione **Métricas**.

1. Seleccione el espacio de nombres **Glue**.

**Para ver métricas mediante la AWS CLI**
+ En el símbolo del sistema, ejecute el siguiente comando.

  ```
  1. aws cloudwatch list-metrics --namespace Glue
  ```

AWS Glue notifica las métricas para CloudWatch cada 30 segundos y los paneles de métricas de CloudWatch se configuran para mostrarlas cada minuto. Las métricas de AWS Glue representan valores delta que se obtienen de los valores notificados con anterioridad. Si procede, los paneles de métricas acumulan (suman) los valores de 30 segundos para obtener un valor para el último minuto en su totalidad.

### Comportamiento de métricas de AWS Glue para trabajos de Spark
<a name="metrics-overview-spark"></a>

 Las métricas AWS Glue se habilitan en la inicialización de un `GlueContext` en un script y suelen actualizarse solo al final de una tarea de Apache Spark. Representan los valores de la suma en todas las tareas Spark hasta el momento.

No obstante, las métricas de Spark que AWS Glue transfiere a CloudWatch suelen ser valores absolutos que representan el estado actual en el momento en que se notifican. AWS Glue los notifica a CloudWatch cada 30 segundos, y los paneles de métricas suelen mostrar la media en los puntos de datos recibidos en el último minuto.

AWS GlueLos nombres de las métricas de están precedidos por uno de los siguientes tipos de prefijo:
+ `glue.driver.`: las métricas cuyos nombres comienzan con este prefijo representan las métricas de AWS Glue que provienen de todos los ejecutores en el controlador Spark, o bien las métricas de Spark correspondientes al controlador Spark.
+ `glue.`*Id de ejecutor*`.`: el *Id de ejecutor* es el número de un ejecutor de Spark especificado. Se corresponde con los ejecutores enumerados en los registros.
+ `glue.ALL.`: las métricas cuyos nombres empiezan por este prefijo agregan valores de todos los ejecutores de Spark.

## AWS Glue metrics
<a name="awsglue-metrics"></a>

AWS Glue crea perfiles y envía las siguientes métricas a CloudWatch cada 30 segundos, y el panel de métricas de AWS Glue los informa una vez por minuto:


| Métrica | Descripción | 
| --- | --- | 
| `glue.driver.aggregate.bytesRead` | El número de bytes leídos desde todos los orígenes de datos por todas las tareas de Spark completadas que se ejecutan en todos los ejecutores.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación. <br />Unidades: bytes<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Esta métrica se puede utilizar de la misma manera que la métrica `glue.ALL.s3.filesystem.read_bytes`, con la diferencia de que esta métrica se actualiza al final de una tarea de Spark y también captura orígenes de datos que no son S3. | 
| `glue.driver.aggregate.elapsedTime` | El tiempo transcurrido de ETL en milisegundos (no incluye los tiempos de arranque del trabajo).<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidad: milisegundos<br />Puede utilizarse para determinar cuánto tiempo se tarda en ejecutar una ejecución de trabajo en promedio.<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.aggregate.numCompletedStages` | Número de etapas completadas en este trabajo.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.aggregate.numCompletedTasks` | Número de etapas completadas en el trabajo.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.aggregate.numFailedTasks` | El número de tareas de servicio que han presentado un error.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Los datos se pueden usar para establecer alarmas ante mayor cantidad de errores que podrían sugerir anomalías en los datos, clústeres o scripts. | 
| `glue.driver.aggregate.numKilledTasks` | El número de tareas eliminadas.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.aggregate.recordsRead` | Número de registros leídos de todos los orígenes de datos por todas las tareas de Spark completadas que se ejecutan en todos los ejecutores.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Esta métrica se puede utilizar de manera similar que la métrica `glue.ALL.s3.filesystem.read_bytes`, con la diferencia de que esta métrica se actualiza al final de una tarea de Spark. | 
| `glue.driver.aggregate.shuffleBytesWritten` | El número de bytes que escriben todos los ejecutores para mezclar los datos en forma aleatoria entre ellos desde el informe anterior (acumulados por el panel de métricas de AWS Glue como el número de bytes escritos para este propósito durante el minuto anterior).<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidades: bytes<br />Se puede utilizar para monitorear: mezclas aleatorias de datos en trabajos (combinaciones grandes, agrupados por, repartición, fusión).<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.aggregate.shuffleLocalBytesRead` | El número de bytes que leen todos los ejecutores para mezclar los datos en forma aleatoria entre ellos desde el informe anterior (acumulados por el panel de métricas de AWS Glue como el número de bytes leídos para este propósito durante el minuto anterior).<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`) y `Type` (recuento).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUMA para la agregación.<br />Unidades: bytes<br />Se puede utilizar para monitorear: mezclas aleatorias de datos en trabajos (combinaciones grandes, agrupados por, repartición, fusión).<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.BlockManager.disk.diskSpaceUsed_MB` | Número de megabytes de espacio en disco utilizado en todos los ejecutores.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (calibre).<br />Estadísticas válidas: promedio. Esta es una métrica de Spark, notificada como un valor absoluto.<br />Unidades: megabytes<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.ExecutorAllocationManager.executors.numberAllExecutors` | El número de ejecutores de trabajo que se ejecutan activamente.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (calibre).<br />Estadísticas válidas: promedio. Esta es una métrica de Spark, notificada como un valor absoluto.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.ExecutorAllocationManager.executors.numberMaxNeededExecutors` | Número máximo de ejecutores de trabajos (en ejecución activa y pendientes) necesarios para satisfacer la carga actual.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (calibre).<br />Estadísticas válidas: máximo. Esta es una métrica de Spark, notificada como un valor absoluto.<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.jvm.heap.usage`<br />`glue.`*Id de ejecutor*`.jvm.heap.usage`<br />`glue.ALL.jvm.heap.usage` | La fracción de memoria usada por el montón de JVM para este controlador (escala: 0-1), ejecutor identificado por el Id de ejecutor o TODOS los ejecutores.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (calibre).<br />Estadísticas válidas: promedio. Esta es una métrica de Spark, notificada como un valor absoluto.<br />Unidad: porcentaje<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.jvm.heap.used`<br />`glue.`*Id de ejecutor*`.jvm.heap.used`<br />`glue.ALL.jvm.heap.used` | El número de bytes de memoria utilizados por el montón de JVM para el controlador, el ejecutor identificado por *Id de ejecutor*, o TODOS los ejecutores.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (calibre).<br />Estadísticas válidas: promedio. Esta es una métrica de Spark, notificada como un valor absoluto.<br />Unidades: bytes<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.s3.filesystem.read_bytes`<br />`glue.`*Id de ejecutor*`.s3.filesystem.read_bytes`<br />`glue.ALL.s3.filesystem.read_bytes` | El número de bytes leídos desde Amazon S3 por el controlador, un ejecutor identificado por *Id de ejecutor*, o TODOS los ejecutores desde el informe anterior (acumulados por el panel de métricas de AWS Glue como número de bytes leídos durante el minuto anterior).<br />Dimensiones válidas: `JobName`, `JobRunId`, y `Type` (calibre).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUM para la agregación. El área bajo la curva en el panel de métricas de AWS Glue se puede utilizar para comparar visualmente los bytes leídos por dos ejecuciones de trabajos diferentes.<br />Unidad: bytes.<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Los datos resultantes se pueden utilizar para lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.s3.filesystem.write_bytes`<br />`glue.`*Id de ejecutor*`.s3.filesystem.write_bytes`<br />`glue.ALL.s3.filesystem.write_bytes` | El número de bytes que escribe el controlador en Amazon S3, un ejecutor identificado por *Id de ejecutor*, o TODOS los ejecutores desde el informe anterior (agregados por el panel de métricas de AWS Glue como número de bytes escritos durante el minuto anterior).<br />Dimensiones válidas: `JobName`, `JobRunId`, y `Type` (calibre).<br />Estadísticas válidas: SUMA. Esta métrica es un valor delta desde el último valor notificado, por lo que en el panel de métricas de AWS Glue, se utiliza una estadística SUM para la agregación. El área bajo la curva en el panel de métricas de AWS Glue se puede utilizar para comparar visualmente los bytes escritos por dos ejecuciones de trabajos diferentes.<br />Unidades: bytes<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.streaming.numRecords` | El número de registros que se reciben en un microlote. Esta métrica solo está disponible para trabajos de streaming de AWS Glue con la versión AWS Glue 2.0 y superior.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (recuento).<br />Estadísticas válidas: suma, máximo, mínimo, promedio, percentilo<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.streaming.batchProcessingTimeInMs` | El tiempo que se tarda en procesar los lotes en milisegundos. Esta métrica solo está disponible para trabajos de streaming de AWS Glue con la versión AWS Glue 2.0 y superior.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (recuento).<br />Estadísticas válidas: suma, máximo, mínimo, promedio, percentilo<br />Unidad: recuento<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 
| `glue.driver.system.cpuSystemLoad`<br />`glue.`*Id de ejecutor*`.system.cpuSystemLoad`<br />`glue.ALL.system.cpuSystemLoad` | Fracción de la carga del sistema de CPU usada (escala: 0-1) por el controlador, un ejecutor identificado por *Id de ejecutor*, o TODOS los ejecutores.<br />Dimensiones válidas: `JobName` (el nombre del trabajo de AWS Glue), `JobRunId` (el ID de JobRun o `ALL`), y `Type` (calibre).<br />Estadísticas válidas: promedio. Esta métrica se notifica como un valor absoluto.<br />Unidad: porcentaje<br />Se puede utilizar para monitorear lo siguiente:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html)<br />Algunas formas de usar los datos:[See the AWS documentation website for more details](http://docs.aws.amazon.com/es_es/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) | 

## Dimensiones de las métricas de AWS Glue
<a name="awsglue-metricdimensions"></a>

Las métricas de AWS Glue utilizan el espacio de nombres de AWS Glue y proporcionan métricas para las siguientes dimensiones:


| Dimensión | Descripción | 
| --- | --- | 
| `JobName` | Esta dimensión filtra las métricas de todas las ejecuciones de trabajos de un trabajo de AWS Glue específico. | 
| `JobRunId` | Esta dimensión filtra las métricas de ejecución de un trabajo de AWS Glue específico por ID de JobRun, o `ALL`. | 
| `Type` | Esta dimensión filtra las métricas por `count` (un número acumulado) o `gauge` (un valor en un punto en el tiempo). | 

Para obtener más información, consulte la [Guía del usuario de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/).