Configurare l'accesso a database e tabelle in AWS Glue Data Catalog
Se si utilizza AWS Glue Data Catalog con Amazon Athena, è possibile definire le policy a livello di risorse per gli oggetti del Catalogo dati del database e della tabella utilizzati in Athena.
Nota
In questo argomento viene illustrata la sicurezza a livello di database e tabella. Per informazioni sulla sicurezza a livello di colonna, riga e cella, consulta Data filtering and cell-level security in Lake Formation (Filtraggio dei dati e sicurezza a livello di cella in Lake Formation).
Puoi definire autorizzazioni a livello di risorse nelle policy IAM basate sulle identità.
Importante
Questa sezione illustra le autorizzazioni a livello di risorsa nelle policy IAM basate su identità. Queste sono diverse dalle policy basate sulle risorse. Per ulteriori informazioni sulle differenze, consulta Policy basate sulle identità e policy basate su risorse nella Guida per l'utente di IAM.
Consulta i seguenti argomenti per queste operazioni:
| Per eseguire questa operazione | Consulta l'argomento seguente |
|---|---|
| Creare una policy IAM che definisca l'accesso granulare alle risorse | Creazione di policy IAM nella Guida per l'utente di IAM. |
| Ottenere informazioni sulle policy (IAM) basate sulle identità utilizzate in AWS Glue | Policy basate sulle identità (policy IAM) nella Guida per lo sviluppatore di AWS Glue. |
In questa sezione
Limitazioni
Quando si utilizza il controllo degli accessi a livello di database e tabella per AWS Glue Data Catalog e Athena:
-
I gruppi di lavoro Athena abilitati per Centro identità IAM richiedono che Lake Formation sia configurato per l'utilizzo delle identità di Centro identità IAM. Per ulteriori informazioni, consulta la pagina Integrating IAM Identity Center nella Guida per gli sviluppatori di AWS Lake Formation.
-
È possibile limitare l'accesso solo a database e tabelle. Questi controlli si applicano a livello di tabella. Non puoi limitare l'accesso a singole partizioni all'interno di una tabella. Per ulteriori informazioni, consulta Informazioni sul controllo degli accessi per le partizioni e le versioni delle tabelle in AWS Glue.
-
Il AWS Glue Data Catalog contiene le risorse seguenti:
CATALOG,DATABASE,TABLEeFUNCTION.Nota
Di questo elenco, le risorse comuni tra Athena e AWS Glue Data Catalog sono
TABLE,DATABASEeCATALOGper ogni account.Functionè specifico per AWS Glue. Per operazioni di eliminazione in Athena, è necessario includere le autorizzazioni per le operazioni AWS Glue. Per informazioni, consulta Esempi di autorizzazioni a livello di database e tabella.La gerarchia è la seguente:
CATALOGè un predecessore di tutti iDATABASESin ogni account e ogniDATABASEè un predecessore per tutte le relativeTABLESeFUNCTIONS. Ad esempio, per una tabella denominatatable_testche appartiene a un databasedbnel catalogo nell'account, i suoi predecessori sonodbe il catalogo nell'account. Per il databasedb, il predecessore è il catalogo nell'account e i relativi discendenti sono le tabelle e le funzioni. Per ulteriori informazioni sulla struttura gerarchica delle risorse, consulta la sezione relativa all'elenco degli ARN nel catalogo dati nella Guida per lo sviluppatore di AWS Glue. -
Per operazioni Athena di non eliminazione su una risorsa, come
CREATE DATABASE,CREATE TABLE,SHOW DATABASE,SHOW TABLEoALTER TABLE, hai bisogno delle autorizzazioni per chiamare tali operazioni sulla risorsa (tabella o database) e su tutti i predecessori della risorsa nel Catalogo dati. Ad esempio, per una tabella, i suoi predecessori sono i database di appartenenza e il catalogo dell'account. Per un database, il predecessore è il catalogo per questo account. Per informazioni, consulta Esempi di autorizzazioni a livello di database e tabella. -
Per un'operazione di eliminazione in Athena, ad esempio
DROP DATABASEoDROP TABLE, è necessaria anche l'autorizzazione a richiamare l'operazione di eliminazione su tutti i predecessori e discendenti della risorsa nel catalogo dati. Ad esempio, per eliminare un database è necessario disporre di autorizzazioni per il database, il catalogo, che è il suo predecessore e tutte le tabelle e le funzioni definite dall'utente, che sono i discendenti. Una tabella non ha discendenti. Per eseguireDROP TABLE, è necessario disporre dell'autorizzazione per questa operazione sulla tabella, il database di appartenenza e il catalogo. Per informazioni, consulta Esempi di autorizzazioni a livello di database e tabella.
Configurare l’accesso AWS Glue al catalogo e al database in base alla Regione AWS
Affinché Athena funzioni con AWS Glue, è necessaria una policy che garantisca l'accesso al tuo database e a AWS Glue Data Catalog nel tuo account in base alla Regione AWS. Per creare database, è richiesta anche l'autorizzazione CreateDatabase. Nella policy di esempio seguente, sostituisci la Regione AWS, l'ID dell'Account AWS e il nome del database con quelli personali.
{ "Sid": "DatabasePermissions", "Effect": "Allow", "Action": [ "glue:GetDatabase", "glue:GetDatabases", "glue:CreateDatabase" ], "Resource": [ "arn:aws:glue:us-east-1:123456789012:catalog", "arn:aws:glue:us-east-1:123456789012:database/default" ] }
Informazioni sul controllo degli accessi per le partizioni e le versioni delle tabelle in AWS Glue
In AWS Glue, le tabelle possono avere partizioni e versioni. Le versioni e le partizioni delle tabelle non sono considerate risorse indipendenti in AWS Glue. L'accesso alle versioni e alle partizioni delle tabelle è determinato dalla concessione dell'accesso nella tabella e nelle risorse predecessore per la tabella.
Ai fini del controllo granulare degli accessi vengono applicate le seguenti autorizzazioni di accesso:
-
I controlli si applicano a livello di tabella. È possibile limitare l'accesso solo a database e tabelle. Ad esempio, se consenti l'accesso a una tabella partizionata, tale accesso si applica a tutte le partizioni della tabella. Non puoi limitare l'accesso a singole partizioni all'interno di una tabella.
Importante
Per eseguire azioni in AWS Glue sulle partizioni, sono necessarie le autorizzazioni per le azioni di partizione a livello di catalogo, database e tabella. L'accesso alle partizioni all'interno di una tabella non è sufficiente. Ad esempio, per l'esecuzione di
GetPartitionssu una tabellamyTablenel databasemyDB, è necessario concedere le autorizzazioni aglue:GetPartitionsper il catalogo, il databasemyDBe le risorsemyTable. -
I controlli degli accessi granulari non si applicano alle versioni delle tabelle. Come per le partizioni, l'accesso alle versioni precedenti di una tabella viene concesso attraverso l'accesso alle API delle versioni della tabella in AWS Glue sulla tabella e ai predecessori della tabella.
Per informazioni sulle autorizzazioni per le operazioni AWS Glue, consulta Autorizzazioni API AWS Glue: referenza su operazioni e risorse nella Guida per lo sviluppatore di AWS Glue.
Esempi di autorizzazioni a livello di database e tabella
La tabella seguente elenca esempi di policy IAM basate sulle identità che consentono l'accesso granulare ai database e alle tabelle in Athena. Consigliamo di iniziare con questi esempi e, in base alle esigenze, regolarli per consentire o negare operazioni specifiche a particolari database e tabelle.
Questi esempi includono l'accesso a database e cataloghi in modo che Athena e AWS Glue possano lavorare insieme. Per regioni AWS multiple, includi policy simili per ognuno dei database e cataloghi, una riga per ciascuna regione.
In questi esempi, sostituisci il database example_db e la tabella test con i nomi dei tuoi database e tabelle.
| Istruzione DDL | Esempio di policy di accesso IAM che concede l'accesso alla risorsa |
|---|---|
| ALTER DATABASE | Consente di modificare le proprietà del database example_db.
|
| CREATE DATABASE | Consente di creare il database denominato example_db.
|
| CREATE TABLE | Consente di creare una tabella denominata test nel database example_db.
|
| DROP DATABASE | Consente di eliminare il database example_db, comprese tutte le tabelle in esso contenute.
|
| DROP TABLE | Consente di eliminare una tabella partizionata denominata test nel database example_db. Se la tabella non ha partizioni, non occorre includere operazioni di partizione.
|
| MSCK REPAIR TABLE | Consente di aggiornare i metadati del catalogo dopo aver aggiunto le partizioni compatibili con Hive alla tabella denominata test nel database example_db.
|
| SHOW DATABASES | Consente di elencare tutti i database nel AWS Glue Data Catalog.
|
| SHOW TABLES | Consente di elencare tutte le tabelle nel database example_db.
|