Consulta de vistas materializadas de AWS Glue Data Catalog - Amazon Athena

Consulta de vistas materializadas de AWS Glue Data Catalog

Athena le permite consultar vistas materializadas de AWS Glue Data Catalog. Las vistas materializadas de Glue Data Catalog almacenan los resultados precalculados de las consultas SQL como tablas de Apache Iceberg.

Cuando crea vistas materializadas de Glue Data Catalog mediante Apache Spark en Amazon EMR o AWS Glue, las definiciones de la vista y sus metadatos se almacenan en AWS Glue Data Catalog. Los resultados precalculados se almacenan como tablas de Apache Iceberg en Amazon S3. Puede consultar estas vistas materializadas desde Athena mediante instrucciones SELECT SQL estándar, del mismo modo que consultaría tablas de Iceberg normales.

Requisitos previos

Antes de consultar vistas materializadas en Athena, asegúrese de lo siguiente:

  • La vista materializada existe en AWS Glue Data Catalog y se creó con Apache Spark (Amazon EMR versión 7.12.0 o posterior, o AWS Glue versión 5.1 o posterior)

  • Para consultar vistas materializadas en Athena, necesita los siguientes permisos AWS Lake Formation:

    • Permiso SELECT en la vista materializada

    • Permiso DESCRIBE en la vista materializada

    • Acceso a la ubicación de Amazon S3 subyacente donde se almacenan los datos de vista materializada

  • Los datos subyacentes de la vista materializada se almacenan en buckets de Tablas de Amazon S3 o en buckets de uso general de Amazon S3

  • Tiene acceso a la base de datos de AWS Glue Data Catalog que contiene la vista materializada

  • En el caso de las vistas materializadas almacenadas en los buckets de Tablas de Amazon S3, asegúrese de que su rol de IAM tenga los permisos necesarios para acceder al catálogo de tablas de S3.

Consideraciones y limitaciones

  • Athena no admite las siguientes operaciones para vistas materializadas: ALTER, CREATE MATERIALIZED VIEW, REFRESH MATERIALIZED VIEW, DROP, INSERT, UPDATE, MERGE, DELETE, OPTIMIZE, VACUUM. Para crear vistas materializadas, utilice Apache Spark en Amazon EMR o AWS Glue. Las operaciones de actualización se deben realizar a través de la API de AWS Glue Data Catalog o de Apache Spark. Modifique las vistas materializadas con Apache Spark.

Consulta de vistas materializadas

Athena trata las vistas materializadas como tablas de Iceberg estándar para las operaciones de lectura, lo que le permite acceder a los datos precalculados sin necesidad de cambios especiales de sintaxis o configuración.

Para consultar una vista materializada en Athena, utilice instrucciones SELECT estándar:

SELECT * FROM my_database.sales_summary_mv;

Puede aplicar filtros, agregaciones y uniones tal como lo haría con las tablas normales:

SELECT region, SUM(total_sales) as sales_total FROM my_database.sales_summary_mv WHERE year = 2025 GROUP BY region ORDER BY sales_total DESC;

Operaciones admitidas

Athena no admite las siguientes operaciones en las vistas materializadas:

  • Consultas SELECT: leer datos de vistas materializadas mediante instrucciones SELECT SQL estándar

  • DESCRIBE: ver el esquema y los metadatos de las vistas materializadas

  • SHOW TABLES: enumerar las vistas materializadas junto con otras tablas de una base de datos

  • Operaciones JOIN: unir vistas materializadas con otras tablas o vistas

  • Filtrado y agregación: aplicar cláusulas WHERE, GROUP BY y agregar funciones