Accès aux tables par le biais du AWS Glue Data Catalog intégration Accès direct aux tables

Accès aux données des tables

Il existe plusieurs manières d'accéder aux tables dans les compartiments de tables Amazon S3. Vous pouvez intégrer des tables à des services AWS d'analyse en utilisant AWS Glue Data Catalog ou accéder à des tables directement à l'aide du point de Iceberg REST terminaison Amazon S3 Tables ou du catalogue de tables Amazon S3 pourApache Iceberg. La méthode d’accès que vous utilisez dépend de la configuration du catalogue, du modèle de gouvernance et de vos besoins en matière de contrôle d’accès. Voici un aperçu de ces méthodes d’accès.

AWS Glue Data Catalog intégration: Il s’agit de la méthode d’accès recommandée pour utiliser des tables dans des compartiments de table S3. Cette intégration vous donne une vue unifiée de votre parc de données sur plusieurs services AWS d'analyse via le AWS Glue Data Catalog. Après l'intégration, vous pouvez interroger des tables à l'aide de services tels qu'Athena et Amazon Redshift. L'accès aux tables est géré à l'aide des autorisations IAM. Pour accéder aux tables à l'aide de cette intégration, l'identité IAM que vous utilisez doit accéder aux ressources et actions de vos tables S3, aux AWS Glue Data Catalog objets et au moteur de requêtes que vous utilisez. Pour de plus amples informations, veuillez consulter Gestion des accès pour S3 Tables.
Accès direct: Utilisez cette méthode si vous devez travailler avec des implémentations de catalogues AWS Partner Network (APN), des implémentations de catalogues personnalisés ou si vous devez uniquement effectuer des read/write opérations de base sur des tables au sein d'un même compartiment de tables. L'accès aux tables est géré à l'aide des autorisations IAM. Pour accéder aux tables, l'identité IAM que vous utilisez doit accéder aux ressources de vos tables et aux actions de S3 Tables. Pour de plus amples informations, veuillez consulter Gestion des accès pour S3 Tables.

Accès aux tables par le biais du AWS Glue Data Catalog intégration

Vous pouvez intégrer des compartiments de tables S3 AWS Glue Data Catalog pour accéder aux tables à partir de services AWS d'analyse tels qu'Amazon Athena, Amazon Redshift et Quick. L'intégration les renseigne AWS Glue Data Catalog avec les ressources de votre table et fédère l'accès à ces ressources. Pour plus d’informations sur l’intégration, consultez Intégration des tables Amazon S3 avec AWS services d'analyse.

Les services AWS d'analyse suivants peuvent accéder aux tables via cette intégration :

Accès aux tables à l'aide du AWS Glue REST Iceberg point de terminaison

Une fois vos compartiments de tables S3 intégrés AWS Glue Data Catalog, vous pouvez également utiliser le AWS GlueIceberg REST point de terminaison pour vous connecter aux tables S3 à partir de moteurs de requêtes tiers compatiblesIceberg. Pour de plus amples informations, veuillez consulter Accès aux tables Amazon S3 à l'aide du AWS Glue REST Iceberg point de terminaison.

Nous vous recommandons d’utiliser le point de terminaison AWS Glue Iceberg REST lorsque vous souhaitez accéder à des tables à partir de Spark, PyIceberg ou d’autres clients compatibles avec Iceberg.

Les clients suivants peuvent accéder aux tables directement via le point de terminaison AWS Glue Iceberg REST :

N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.

Accès direct aux tables

Vous pouvez accéder aux tables directement à partir de moteurs de requêtes open source grâce à des méthodes qui relient les opérations de gestion de S3 Tables à vos applications d’analytique Apache Iceberg. Il existe deux méthodes d’accès direct : le point de terminaison Iceberg REST d’Amazon S3 Tables ou le catalogue d’Amazon S3 Tables pour Apache Iceberg. Le point de terminaison REST est recommandé.

Nous recommandons un accès direct si vous accédez aux tables dans le cadre d'implémentations de catalogues autogérées ou si vous devez uniquement effectuer des read/write opérations de base sur les tables d'un seul compartiment de tables. Pour les autres scénarios d'accès, nous recommandons l' AWS Glue Data Catalog intégration.

L’accès direct aux tables est géré par le biais de politiques basées sur l’identité IAM ou de politiques basées sur les ressources associées aux tables et aux compartiments de table.

Accès aux tables via les tables Amazon S3 REST Iceberg point de terminaison

Vous pouvez utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour accéder à vos tables directement depuis n’importe quel client compatible Iceberg REST via des points de terminaison HTTP. Pour plus d’informations, consultez Accès aux tables à l'aide des tables Amazon S3 REST Iceberg point de terminaison.

Les services AWS d'analyse et moteurs de requêtes suivants peuvent accéder aux tables directement via le point de Iceberg REST terminaison Amazon S3 Tables :

Moteurs de requête pris en charge

N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.
Amazon EMR
AWS Glue ETL

Accès aux tables directement via le catalogue de tables Amazon S3 pour Apache Iceberg

Vous pouvez également accéder directement aux tables à partir des moteurs de requête comme Apache Spark en utilisant le catalogue client de S3 Tables. Pour plus d’informations, consultez Accès aux tables Amazon S3 avec le catalogue de tables Amazon S3 pour Apache Iceberg. S3 recommande toutefois d’utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour un accès direct, car il prend en charge un plus grand nombre d’applications, sans nécessiter de langage ou de code spécifique au moteur.

Les moteurs de requête suivants peuvent accéder aux tables directement à l’aide du catalogue client :

Apache Spark

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Supprimer un tag d'un tableau

Présentation de l’intégration de S3 Tables