Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Intégration des tables Amazon S3 aux services AWS d'analyse
Cette rubrique décrit les prérequis et les procédures nécessaires pour intégrer vos compartiments de table Amazon S3 aux services AWS d'analyse. Pour un aperçu du fonctionnement de l’intégration, consultez Présentation de l’intégration de S3 Tables.
Note
Cette intégration utilise les AWS Lake Formation services AWS Glue et peut entraîner des coûts de AWS Glue demande et de stockage. Pour plus d’informations, consultez Tarification d’AWS Glue
Une tarification supplémentaire s’applique à l’exécution de requêtes sur vos tables S3. Pour plus d’informations, consultez les informations de tarification du moteur de requêtes que vous utilisez.
Conditions préalables à l’intégration
Les conditions préalables suivantes sont requises pour intégrer des compartiments de tables aux services d' AWS analyse :
Associez la politique AWSLakeFormationDataAdmin AWS gérée à votre principal AWS Identity and Access Management (IAM) pour faire de cet utilisateur un administrateur de data lake. Pour plus d’informations sur la manière de créer un administrateur de lac de données, consultez Création d’un administrateur de lac de données dans le Guide du développeur AWS Lake Formation .
-
Ajoutez des autorisations pour l’opération
glue:PassConnectionà votre principal IAM. -
Ajoutez des autorisations pour les opérations
lakeformation:RegisterResourceetlakeformation:RegisterResourceWithPrivilegedAccessà votre principal IAM. Effectuez une mise à jour vers la dernière version de AWS Command Line Interface (AWS CLI).
Important
Lorsque vous créez des tables, assurez-vous d’utiliser toutes les lettres minuscules dans les noms et les définitions de tables. Par exemple, assurez-vous que les noms des tables et des colonnes sont tous en minuscules. Si le nom ou la définition de votre table contient des majuscules, le tableau n'est pas pris en charge par AWS Lake Formation le AWS Glue Data Catalog. Dans ce cas, votre table ne sera pas visible par les services d' AWS analyse tels qu'Amazon Athena, même si vos compartiments de tables sont intégrés aux AWS services d'analyse.
Si la définition de votre table contient des majuscules, le message d'erreur suivant s'affiche lorsque vous exécutez une SELECT requête dans Athena : « GENERIC_INTERNAL_ERROR : Get table request failed : com.amazonaws.services.glue.model. ValidationException: ressource de fédération non prise en charge - Noms de table ou de colonne non valides. »
Intégration de compartiments de tables aux services d' AWS analyse
Amazon S3 Tables s'intègre à AWS Glue Data Catalog (Data Catalog) et enregistre le catalogue en tant que localisation de données de Lake Formation. Vous pouvez configurer cet enregistrement depuis la console Lake Formation ou en utilisant le service APIs. Lorsque vous enregistrez l'emplacement, vous devez spécifier un rôle IAM qui accorde des read/write autorisations au rôle enregistré de Lake Formation pour accéder à cet emplacement. Lake Formation assume ce rôle lorsqu'il fournit des informations d'identification temporaires aux AWS services intégrés.
Si vous avez une politique basée sur les ressources IAM ou S3 Tables qui restreint les utilisateurs IAM et les rôles IAM en fonction des balises principales, vous devez associer les mêmes balises principales au rôle IAM que Lake Formation utilise pour accéder à vos données Amazon S3 (par exemple LakeFormationDataAccessRole,) et accorder à ce rôle les autorisations nécessaires. Cela est nécessaire pour que votre politique de contrôle d'accès basée sur des balises fonctionne correctement avec votre intégration d'analyse S3 Tables.
Cette intégration doit être configurée une fois par AWS région.
Important
L'intégration des services d' AWS analyse utilise désormais l'WithPrivilegedAccessoption de l'opération d'API registerResource Lake Formation pour enregistrer des buckets de tables S3. L'intégration crée également désormais le s3tablescatalog catalogue dans le AWS Glue Data Catalog en utilisant l'AllowFullTableExternalDataAccessoption dans l'opération CreateCatalog AWS Glue API.
Si vous avez configuré l’intégration avec la version préliminaire, vous pouvez continuer à utiliser votre intégration actuelle. Cependant, étant donné que le processus d’intégration mis à jour améliore les performances, nous vous recommandons de procéder à la migration. Pour migrer vers l’intégration mise à jour, consultez Migration vers le processus d’intégration mis à jour.
Ouvrez la console Amazon S3 à l'adresse https://console.aws.amazon.com/s3/
. Dans le volet de navigation de gauche, choisissez Compartiments de tables.
Choisissez Créer un compartiment de tables.
La page Créer un compartiment de tables s’ouvre.
Saisissez un Nom du compartiment de table et veillez à ce que la case Activer l’intégration soit cochée.
Choisissez Créer un compartiment de tables. Amazon S3 essaiera d’intégrer automatiquement vos compartiments de tables dans cette région.
La première fois que vous intégrez des compartiments de table dans une région, Amazon S3 crée un nouveau rôle de service IAM en votre nom. Ce rôle permet à Lake Formation d’accéder à tous les compartiments de tables de votre compte et de fédérer l’accès à vos tables dans le AWS Glue Data Catalog.
Pour intégrer des seaux de table à l'aide du AWS CLI
Les étapes suivantes montrent comment utiliser le AWS CLI pour intégrer des compartiments de table. Pour utiliser ces étapes, remplacez les par vos propres informations.user input placeholders
Créez un compartiment de tables.
aws s3tables create-table-bucket \ --regionus-east-1\ --nameamzn-s3-demo-table-bucket-
Créez un rôle de service IAM qui permet à Lake Formation d’accéder à vos ressources de table.
-
Créez un fichier
Role-Trust-Policy.jsoncontenant la stratégie d’approbation suivante :Créez le rôle de service IAM à l’aide de la commande suivante :
aws iam create-role \ --role-nameS3TablesRoleForLakeFormation\ --assume-role-policy-document file://Role-Trust-Policy.json -
Créez un fichier
LF-GluePolicy.jsoncontenant la stratégie suivante :Attachez la stratégie au rôle en utilisant la commande suivante :
aws iam put-role-policy \ --role-nameS3TablesRoleForLakeFormation\ --policy-name LakeFormationDataAccessPermissionsForS3TableBucket \ --policy-document file://LF-GluePolicy.json
-
-
Créez un fichier
input.jsoncontenant ce qui suit :{ "ResourceArn": "arn:aws:s3tables:us-east-1:111122223333:bucket/*", "WithFederation": true, "RoleArn": "arn:aws:iam::111122223333:role/S3TablesRoleForLakeFormation" }Enregistrez les compartiments de table auprès de Lake Formation en utilisant la commande suivante :
aws lakeformation register-resource \ --regionus-east-1\ --with-privileged-access \ --cli-input-json file://input.json -
Créez un fichier
catalog.jsoncontenant le catalogue qui suit :{ "Name": "s3tablescatalog", "CatalogInput": { "FederatedCatalog": { "Identifier": "arn:aws:s3tables:us-east-1:111122223333:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions":[], "CreateTableDefaultPermissions":[], "AllowFullTableExternalDataAccess": "True" } }Créez le catalogue
s3tablescatalogà l’aide de la ligne de commande suivante. La création de ce catalogue remplit le AWS Glue Data Catalog avec des objets correspondant à des compartiments de tables, à des espaces de noms et à des tables.aws glue create-catalog \ --regionus-east-1\ --cli-input-json file://catalog.json Vérifiez que le
s3tablescatalogcatalogue a été ajouté à AWS Glue l'aide de la commande suivante :aws glue get-catalog --catalog-id s3tablescatalog
Le processus d'intégration des services d' AWS analyse a été mis à jour. Si vous avez configuré l’intégration avec la version préliminaire, vous pouvez continuer à utiliser votre intégration actuelle. Cependant, le processus d’intégration mis à jour améliorant les performances, nous vous recommandons de procéder à la migration en suivant les étapes ci-dessous. Pour plus d’informations sur le processus de migration ou d’intégration, consultez Création d’un catalogue d’Amazon S3 Tables dans le AWS Glue Data Catalog dans le Guide du développeur AWS Lake Formation .
-
Ouvrez la AWS Lake Formation console sur https://console.aws.amazon.com/lakeformation/
et connectez-vous en tant qu'administrateur du lac de données. Pour plus d’informations sur la manière de créer un administrateur de lac de données, consultez Création d’un administrateur de lac de données dans le Guide du développeur AWS Lake Formation . -
Supprimez le catalogue
s3tablescatalogen procédant comme suit :-
Dans le volet de navigation de gauche, choisissez Catalogues.
-
Sélectionnez le bouton d’option situé à côté du catalogue
s3tablescatalogdans la liste Catalogues. Dans le menu Actions, sélectionnez Delete (Supprimer).
-
-
Désenregistrez l’emplacement des données du catalogue
s3tablescatalogen procédant comme suit :-
Dans le volet de navigation de gauche, accédez à la section Administration, puis choisissez Emplacements de lac de données.
-
Choisissez le bouton d’option en regard de l’emplacement du lac de données
s3tablescatalog, par exemples3://tables:.region:account-id:bucket/* -
Dans le menu Actions, choisissez Supprimer.
-
Dans la boîte de dialogue de confirmation qui s’affiche, choisissez Supprimer.
-
-
Maintenant que vous avez supprimé l'emplacement de votre
s3tablescatalogcatalogue et de votre lac de données, vous pouvez suivre les étapes pour intégrer vos compartiments de tables aux services AWS d'analyse en utilisant le processus d'intégration mis à jour.
Note
Si vous souhaitez utiliser des tables chiffrées SSE-KMS dans des services AWS d'analyse intégrés, le rôle que vous utilisez doit être autorisé à utiliser votre AWS KMS clé pour les opérations de chiffrement. Pour de plus amples informations, veuillez consulter Octroi aux principaux IAM des autorisations leur permettant de travailler avec des tables chiffrées dans les services d'analyse intégrés AWS.
Une fois que vous avez intégré, votre principal IAM a obtenu les autorisations Lake Formation pour accéder à vos tables. Si vous souhaitez autoriser d’autres principaux IAM à accéder aux tables, vous devez accorder des autorisations Lake Formation sur vos tables à ces principaux. Pour de plus amples informations, veuillez consulter Gestion de l’accès à une table ou à une base de données avec Lake Formation.