Administración de la capacidad de procesamiento de consultas - Amazon Athena

Administración de la capacidad de procesamiento de consultas

Puede utilizar las reservas de capacidad a fin de obtener una capacidad de procesamiento sin servidor dedicada para las consultas que ejecute en Athena. Con las reservas de capacidad, puede aprovechar las funciones de administración de la carga de trabajo que lo ayudan a priorizar, controlar y escalar sus cargas de trabajo más importantes. Por ejemplo, puede añadir capacidad para controlar la cantidad de consultas que puede ejecutar al mismo tiempo, elegir qué cargas de trabajo pueden utilizar la capacidad y compartir la capacidad entre las cargas de trabajo. La capacidad es sin servidor y Athena la administra por completo y la conserva durante el tiempo que la necesite. La configuración es sencilla y no es necesario realizar cambios en las consultas SQL.

A fin de obtener capacidad de procesamiento para sus consultas, cree una reserva de capacidad, especifique la cantidad de unidades de procesamiento de datos (DPU) que necesita y asigne uno o más grupos de trabajo a la reserva.

Los grupos de trabajo desempeñan un rol importante cuando se utilizan reservas de capacidad. Los grupos de trabajo permiten organizar las consultas en agrupaciones lógicas o casos de uso. Con las reservas de capacidad, puede asignar capacidad a los grupos de trabajo de forma selectiva para controlar el comportamiento de las consultas de cada grupo de trabajo y la forma en que se facturan. Para obtener información acerca de los grupos de trabajo, consulte Uso de grupos de trabajo para controlar el acceso a las consultas y los costos.

Al asignar grupos de trabajo a las reservas de capacidad, puede dar prioridad a estas consultas, ya que se ejecutan en la capacidad reservada y no se tienen en cuenta para la cuota de consultas de DDL y DML. Por ejemplo, puede asignar capacidad a un grupo de trabajo que se utilice para consultas de informes financieros urgentes a fin de aislarlas de las consultas menos importantes de otro grupo de trabajo. Esto permite una ejecución predecible de las consultas para las cargas de trabajo importantes y, al mismo tiempo, permite que otras cargas de trabajo se ejecuten de forma independiente.

Puede utilizar las reservas de capacidad y los grupos de trabajo de forma conjunta para cumplir distintos requisitos. A continuación se muestran algunas situaciones de ejemplo:

  • Aísle las consultas importantes: para garantizar que una carga de trabajo importante tenga la capacidad que necesita cuando la necesita, cree una reserva de capacidad y asigne su grupo de trabajo a la reserva. Solo las consultas del grupo de trabajo asignado utilizan la capacidad de procesamiento de la reserva elegida. Por ejemplo, para garantizar la ejecución fiable de las consultas compatibles con una aplicación de producción, debe asignar el grupo de trabajo de producción para esas consultas a una reserva de capacidad. Al desarrollar las consultas, utilice un grupo de trabajo independiente que no esté asociado a una reserva y mueva las consultas al grupo de trabajo de producción cuando estén listas.

  • Comparta capacidad en cargas de trabajo similares: varias cargas de trabajo pueden compartir capacidad de una reserva. Esto le permite lograr un costo predecible para estas cargas de trabajo y controlar su simultaneidad. Por ejemplo, si tiene cargas de trabajo programadas que son tolerantes a horas de inicio de ejecución de consultas retrasadas, puede asignar sus grupos de trabajo a una única reserva. Esto libera la cuota de consultas DDL y DML para consultas interactivas que se ejecutan en la misma cuenta, lo que garantiza que estas consultas se inicien con un retraso mínimo.

Descripción de las DPU

La capacidad se mide en unidades de procesamiento de datos (DPU). Las DPU representan los recursos de computación sin servidor y memoria que Athena utiliza para acceder a los datos y procesarlos en su nombre. Normalmente, una DPU proporciona 4 vCPU y 16 GB de memoria. La cantidad de DPU que retenga influirá en la cantidad de consultas que puede ejecutar de forma simultánea. Por ejemplo, una reserva con 256 DPU puede permitir aproximadamente el doble de consultas simultáneas que una reserva con 128 DPU.

Para obtener información sobre cómo calcular sus requisitos de capacidad, consulte Determinación de los requisitos de capacidad. Para obtener información sobre precios, consulte Precios de Amazon Athena.

Consideraciones y limitaciones

  • Puede utilizar las reservas de capacidad y la facturación por consulta basadas en los datos escaneados al mismo tiempo y en la misma cuenta.

  • Las consultas que se ejecutan con reservas de capacidad no se tienen en cuenta para la cuota de consultas de DDL y DML.

  • Si su capacidad está ocupada atendiendo otras consultas, las consultas que enviadas recientemente se pondrán en cola hasta que haya capacidad disponible. El tiempo máximo permitido de espera es de 10 horas.

  • Un grupo de trabajo se puede asignar a una reserva de capacidad cada vez. Puede asignar un total de 20 grupos de trabajo a una sola reserva. Al asignar varios grupos de trabajo a una reserva, la capacidad se comparte entre los grupos de trabajo y se asigna a las consultas en función del orden de envío. Puede haber variaciones en el orden de ejecución debido a la forma en que Athena asigna dinámicamente la capacidad a las consultas.

  • Athena asigna automáticamente entre 4 y 124 DPU a las consultas DML en función de su complejidad. Las consultas DDL consumen 4 DPU cada una. Para obtener más información, consulte los siguientes temas:

  • La cantidad mínima de DPU necesarias con cada reserva de capacidad es 4. Para obtener información sobre precios, consulte Precios de Amazon Athena.

  • Puede crear hasta 100 reservas de capacidad con un total de hasta 1000 DPU por cuenta y región. Si necesita más de 1000 DPU para su caso de uso, póngase en contacto con athena-feedback@amazon.com.

  • Las solicitudes de capacidad no están garantizadas y se pueden completar en hasta 30 minutos. La capacidad no es transferible a otra reserva de capacidad, Cuenta de AWS o Región de AWS.

  • La métrica de CloudWatch DPUConsumed es por grupo de trabajo y no por reserva. Por lo tanto, si mueve un grupo de trabajo de una reserva a otra, la métrica DPUConsumed incluye datos del momento en que el grupo de trabajo pertenecía a la primera reserva. Para obtener más información sobre las métricas de CloudWatch en Athena, consulte Supervisión de las métricas de consultas de Athena con CloudWatch.

  • Para eliminar un grupo de trabajo que se ha asignado a una reserva, elimine primero el grupo de trabajo de la reserva.

  • No se admiten grupos de trabajo configurados para usar Apache Spark.

  • Las reservas de capacidad están disponibles en las siguientes Regiones de AWS:

    • Este de EE. UU. (Norte de Virginia)

    • Este de EE. UU. (Ohio)

    • Oeste de EE. UU. (Oregón)

    • Asia-Pacífico (Mumbai)

    • Asia-Pacífico (Singapur)

    • Asia-Pacífico (Sídney)

    • Asia Pacífico (Tokio)

    • Europa (Irlanda)

    • Europa (España)

    • Europa (Estocolmo)

    • América del Sur (São Paulo)