Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Tutorial: Nozioni di base su Tabelle S3
In questo tutorial, crei un table bucket e integri i table bucket della tua regione con i servizi di analisi. AWS Successivamente, utilizzerai la console AWS CLI or per creare il tuo primo namespace e la tua prima tabella nel tuo table bucket. Quindi, puoi iniziare a interrogare il tuo tavolo con Athena.
Suggerimento
Per migrare dati tabulari da bucket per uso generico a bucket di tabelle, la Biblioteca di soluzioni AWS offre all’utente una soluzione guidata. Questa soluzione automatizza lo spostamento Apache Iceberg e le Apache Hive tabelle registrate AWS Glue Data Catalog e archiviate in bucket generici su bucket da tavolo utilizzando AWS Step Functions Amazon EMR con. Apache Spark Per ulteriori informazioni, consulta Linee guida per la migrazione dei dati tabulari da Amazon S3 a Tabelle S3
Argomenti
Fase 1: creare un table bucket e integrarlo con i servizi di analisi AWS
In questa fase utilizzi la console Amazon S3 per creare il tuo primo bucket di tabelle. Per conoscere altri metodi per creare un bucket di tabelle, consulta Creazione di un bucket di tabelle.
Nota
Per impostazione predefinita, la console Amazon S3 integra automaticamente i bucket di tabelle AWS Glue Data Catalog, il che consente ai servizi di AWS analisi di scoprire e accedere automaticamente ai dati di S3 Tables. Se crei il tuo primo table bucket in modo programmatico utilizzando l'API AWS Command Line Interface (AWS CLI) o REST AWS SDKs, devi completare manualmente l'integrazione dei servizi di analisi. AWS Per ulteriori informazioni, consulta Integrazione delle tabelle AWS Amazon S3 con i servizi di analisi.
Accedi a Console di gestione AWS e apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
Nella barra di navigazione nella parte superiore della pagina, scegli il nome del file attualmente visualizzato Regione AWS. Quindi, scegli la Regione in cui creare il bucket di tabelle.
Nel pannello di navigazione a sinistra, scegli Bucket di tabelle.
Seleziona Crea bucket di tabelle.
In Configurazione generale, inserisci un nome per il bucket di tabelle.
Il nome del bucket di tabelle deve:
Sii unico per te Account AWS nella regione attuale.
Deve contenere da 3 a 63 caratteri
È composto solo da lettere minuscole, numeri e trattini ().
-Iniziare e finire con una lettera o un numero.
Una volta creato il bucket di tabelle, non è possibile modificarne il nome. Chi crea Account AWS il table bucket ne è proprietario. Per ulteriori informazioni sulla denominazione dei bucket di tabelle, consulta Regole di denominazione dei bucket di tabelle.
-
Nella sezione Integrazione con i servizi di AWS analisi, assicurati che la casella di controllo Abilita integrazione sia selezionata.
Se l'opzione Abilita integrazione è selezionata quando crei il tuo primo table bucket utilizzando la console, Amazon S3 tenta di integrare il tuo table bucket AWS con i servizi di analisi. Questa integrazione consente di utilizzare i servizi di AWS analisi per accedere a tutte le tabelle nella regione corrente. Per ulteriori informazioni, consulta Integrazione delle tabelle AWS Amazon S3 con i servizi di analisi.
Seleziona Crea bucket.
Fase 2: creare un namespace di tabelle e una tabella
In questa fase si crea un namespace nel bucket di tabelle e quindi si crea una nuova tabella nel namespace. È possibile creare un namespace di tabelle e una tabella utilizzando la console o la AWS CLI.
Importante
Durante la creazione delle tabelle, è necessario utilizzare solo lettere minuscole nei nomi delle tabelle e nelle definizioni delle tabelle. Ad esempio, è necessario verificare che i nomi delle colonne siano tutti in minuscolo. Se il nome o la definizione della tabella contengono lettere maiuscole, la tabella non è supportata da AWS Lake Formation o da AWS Glue Data Catalog. In questo caso, la tua tabella non sarà visibile ai servizi di AWS analisi come Amazon Athena, anche se i tuoi table bucket sono integrati con AWS servizi di analisi.
Se la definizione della tabella contiene lettere maiuscole, ricevi il seguente messaggio di errore quando esegui una SELECT query in Athena: «GENERIC_INTERNAL_ERROR: Get table request failed: com.amazonaws.services.glue.model. ValidationException: Risorsa federativa non supportata: nomi di tabelle o colonne non validi».
La procedura seguente utilizza la console di Amazon S3 per creare un namespace e una tabella con Amazon Athena.
Come creare un namespace e una tabella
Accedi a Console di gestione AWS e apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
Nel pannello di navigazione a sinistra, scegli Bucket di tabelle.
-
Nella pagina Bucket di tabelle, scegli il bucket di tabelle in cui creare una tabella.
-
Nella pagina dei dettagli del bucket di tabelle, scegli Crea tabella con Athena.
-
Nella finestra di dialogo Crea tabella con Athena, scegli Crea un namespace, quindi inserisci un nome nel campo Nome del namespace. I nomi dei namespace devono essere composti da un numero di caratteri compreso tra 1 e 255 ed essere univoci all’interno del bucket di tabelle. I caratteri validi sono a-z, 0-9 e i caratteri di sottolineatura (
_). I caratteri di sottolineatura non sono consentiti all’inizio dei nomi dei namespace. -
Selezionare Crea namespace.
-
Scegli Crea tabella con Athena.
-
Si apre la console Amazon Athena e viene visualizzato l’editor di query Athena. L’editor di query è popolato con una query di esempio da utilizzare per creare una tabella. Modifica la query per specificare il nome della tabella e le colonne della tabella.
-
Una volta modificata la query, scegli Esegui per creare la tabella.
Se la creazione della tabella viene completata, il nome della nuova tabella viene visualizzato nell’elenco delle tabelle in Athena. Quando torni alla console Amazon S3, la nuova tabella viene visualizzata nell’elenco Tabelle nella pagina dei dettagli del bucket di tabelle, dopo aver aggiornato l’elenco.
Per utilizzare i seguenti comandi di AWS CLI esempio per creare uno spazio dei nomi nel bucket di tabella e quindi creare una nuova tabella con uno schema in tale spazio dei nomi, sostituisci i valori con i tuoi.user input
placeholder
Prerequisiti
-
Collegare la policy
AmazonS3TablesFullAccessall’identità IAM. -
Installa AWS CLI la versione 2.23.10 o successiva. Per ulteriori informazioni, consulta Installazione o aggiornamento della versione più recente della AWS CLI nella Guida per l'utente di AWS Command Line Interface .
Crea un nuovo namespace nel bucket di tabelle eseguendo il comando seguente:
aws s3tables create-namespace \ --table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket\ --namespacemy_namespaceVerifica che il namespace sia stato creato correttamente eseguendo il comando seguente:
aws s3tables list-namespaces \ --table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket
Crea una nuova tabella con uno schema di tabella eseguendo il seguente comando:
aws s3tables create-table --cli-input-json file://mytabledefinition.jsonPer il file
mytabledefinition.json, utilizza la seguente definizione di tabella di esempio:{ "tableBucketARN": "arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket", "namespace": "my_namespace", "name": "my_table", "format": "ICEBERG", "metadata": { "iceberg": { "schema": { "fields": [{"name": "id", "type": "int","required": true}, {"name": "name", "type": "string"}, {"name": "value", "type": "int"}] } } } }
Passaggio 3: interrogare i dati con SQL in Athena
È possibile eseguire query sulla tabella con SQL in Athena. Athena supporta le query Data Definition Language (DDL), Data Manipulation Language (DML) e Data Query Language (DQL) per Tabelle S3.
È possibile accedere alla query Athena dalla console Amazon S3 o tramite la console Amazon Athena.
La procedura seguente utilizza la console Amazon S3 per accedere all’editor di query Athena in modo da poter eseguire query su una tabella con Amazon Athena.
Come eseguire query su una tabella
Accedi a Console di gestione AWS e apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
Nel pannello di navigazione a sinistra, scegli Bucket di tabelle.
-
Nella pagina Bucket di tabelle, scegli il bucket di tabelle contenente la tabella sui cui desideri eseguire la query.
-
Nella pagina dei dettagli del bucket di tabelle, scegli il pulsante di opzione accanto al nome della tabella su cui desideri eseguire una query.
-
Scegli Interroga tabella con Athena.
-
Si apre la console Amazon Athena e viene visualizzato l’editor di query Athena con una query
SELECTdi esempio caricata automaticamente. Modifica questa query in base alle esigenze del caso d’uso. -
Per eseguire la query, scegli Run (Esegui).
Come eseguire query su una tabella
Apri la console Athena all'indirizzo https://console.aws.amazon.com/athena/
. -
Eseguire una query sulla tabella. Di seguito è riportata una query di esempio che è possibile modificare. Assicurarsi di sostituire
con le proprie informazioni.user input placeholdersSELECT * FROM "s3tablescatalog/amzn-s3-demo-table-bucket"."my_namespace"."my_table" LIMIT 10 -
Per eseguire la query, scegli Run (Esegui).