Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Accès aux données des tables
Il existe plusieurs manières d'accéder aux tables dans les compartiments de tables Amazon S3. Vous pouvez intégrer des tables à des services d' AWS analyse à l'aide d'Amazon SageMaker Lakehouse ou accéder aux tables directement à l'aide du point de Iceberg REST terminaison Amazon S3 Tables ou du catalogue de tables Amazon S3 pour. Apache Iceberg La méthode d’accès que vous utilisez dépend de la configuration du catalogue, du modèle de gouvernance et de vos besoins en matière de contrôle d’accès. Voici un aperçu de ces méthodes d’accès.
- Intégration avec Amazon SageMaker Lakehouse
Il s’agit de la méthode d’accès recommandée pour utiliser des tables dans des compartiments de table S3. L'intégration permet une gestion unifiée des tables, une gouvernance centralisée et un contrôle d'accès précis entre plusieurs services AWS d'analyse. Après l’intégration, vous pouvez interroger des tables dans des services tels qu’Athena et Amazon Redshift.
- Accès direct
Utilisez cette méthode si vous devez travailler avec des implémentations de catalogues AWS Partner Network (APN), des implémentations de catalogues personnalisés ou si vous devez uniquement effectuer des read/write opérations de base sur les tables d'un seul compartiment de tables.
Note
Pour accéder aux tables, l’identité IAM que vous utilisez doit accéder aux ressources de vos tables et aux actions de S3 Tables. Pour de plus amples informations, veuillez consulter Gestion des accès pour S3 Tables.
Accès aux tables via l'intégration Amazon SageMaker Lakehouse
Vous pouvez intégrer des compartiments de tables S3 à Amazon SageMaker Lakehouse pour accéder aux tables à partir de services AWS d'analyse tels qu'Amazon Athena, Amazon Redshift et Quick Suite. Amazon SageMaker Lakehouse unifie vos données entre les lacs de données Amazon S3 et les entrepôts de données Amazon Redshift, afin que vous puissiez créer des applications d'analyse, d'apprentissage automatique (ML) et d'IA générative sur une seule copie des données. L'intégration remplit les ressources AWS Glue Data Catalog de votre table et fédère l'accès à ces ressources avec. AWS Lake Formation Pour plus d’informations sur l’intégration, consultez Intégration des tables Amazon S3 aux services AWS d'analyse.
L'intégration permet un contrôle d'accès précis AWS Lake Formation afin de renforcer la sécurité. Lake Formation utilise une combinaison de son propre modèle d’autorisations et du modèle d’autorisations IAM pour contrôler l’accès aux ressources des tables et aux données sous-jacentes. Cela signifie qu’une demande d’accès à votre table doit passer les contrôles d’autorisation effectués à la fois par IAM et par Lake Formation. Pour plus d’informations, consultez Présentation des autorisations Lake Formation dans le Guide du développeur AWS Lake Formation .
Les services AWS d'analyse suivants peuvent accéder aux tables via cette intégration :
Accès aux tables à l’aide du point de terminaison AWS Glue Iceberg REST
Une fois que vos compartiments de tables S3 sont intégrés à Amazon SageMaker Lakehouse, vous pouvez également utiliser le AWS GlueIceberg REST point de terminaison pour vous connecter aux tables S3 à partir de moteurs de requêtes tiers compatibles. Iceberg Pour de plus amples informations, veuillez consulter Accès à Amazon S3 Tables à l’aide du point de terminaison AWS Glue Iceberg REST.
Nous vous recommandons d’utiliser le point de terminaison AWS Glue Iceberg REST lorsque vous souhaitez accéder à des tables à partir de Spark, PyIceberg ou d’autres clients compatibles avec Iceberg.
Les clients suivants peuvent accéder aux tables directement via le point de terminaison AWS Glue Iceberg REST :
N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.
Accès direct aux tables
Vous pouvez accéder aux tables directement à partir de moteurs de requêtes open source grâce à des méthodes qui relient les opérations de gestion de S3 Tables à vos applications d’analytique Apache Iceberg. Il existe deux méthodes d’accès direct : le point de terminaison Iceberg REST d’Amazon S3 Tables ou le catalogue d’Amazon S3 Tables pour Apache Iceberg. Le point de terminaison REST est recommandé.
Nous recommandons un accès direct si vous accédez aux tables dans le cadre d'implémentations de catalogues autogérées ou si vous devez uniquement effectuer des read/write opérations de base sur les tables d'un seul compartiment de tables. Pour les autres scénarios d'accès, nous recommandons l'intégration Amazon SageMaker Lakehouse.
L’accès direct aux tables est géré par le biais de politiques basées sur l’identité IAM ou de politiques basées sur les ressources associées aux tables et aux compartiments de table. Vous n’avez pas besoin de gérer les autorisations Lake Formation pour les tables lorsque vous y accédez directement.
Accès aux tables via le point de terminaison Iceberg REST d’Amazon S3 Tables
Vous pouvez utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour accéder à vos tables directement depuis n’importe quel client compatible Iceberg REST via des points de terminaison HTTP. Pour plus d’informations, consultez Accès aux tables à l’aide du point de terminaison Iceberg REST d’Amazon S3 Tables.
Les services AWS d'analyse et moteurs de requêtes suivants peuvent accéder aux tables directement via le point de Iceberg REST terminaison Amazon S3 Tables :
Moteurs de requête pris en charge
N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.
Accès direct aux tables via le catalogue d’Amazon S3 Tables pour Apache Iceberg
Vous pouvez également accéder directement aux tables à partir des moteurs de requête comme Apache Spark en utilisant le catalogue client de S3 Tables. Pour plus d’informations, consultez Accès direct aux tables Amazon S3 via le catalogue d’Amazon S3 Tables pour Apache Iceberg. S3 recommande toutefois d’utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour un accès direct, car il prend en charge un plus grand nombre d’applications, sans nécessiter de langage ou de code spécifique au moteur.
Les moteurs de requête suivants peuvent accéder aux tables directement à l’aide du catalogue client :