Usa la console Athena per connettere a un'origine dati
È possibile utilizzare la console Athena per creare e configurare una connessione a un’origine dati.
Per creare una connessione a un'origine dati
Aprire la console Athena all'indirizzo https://console.aws.amazon.com/athena/
. Se il pannello di navigazione della console non è visibile, scegli il menu di espansione a sinistra.
-
Nel pannello di navigazione scegliere Origini dati e cataloghi.
-
Nella pagina Origini dati e cataloghi, scegli Crea origine dati.
-
In Choose a data source (Scegli un'origine dati), scegli l'origine dati su cui eseguire una query con Athena, tenendo conto delle seguenti linee guida:
-
Scegli un'opzione di connessione che corrisponde all'origine dati. Athena dispone di connettori di origine dati predefiniti che è possibile configurare per origini, tra cui MySQL, Amazon DocumentDB e PostgreSQL.
-
Scegli AWS Glue Data Catalog - S3 se desideri interrogare i dati in Amazon S3 senza utilizzare un metastore Apache Hive o una delle altre opzioni di origine dati di query federate in questa pagina. Athena utilizza AWS Glue Data Catalog per archiviare i metadati e le informazioni sullo schema per le origini dati in Amazon S3. Si tratta dell'opzione di default (non federata). Per ulteriori informazioni, consulta Utilizzare AWS Glue Data Catalog per connettersi ai tuoi dati. Per i passaggi relativi all'utilizzo di questo flusso di lavoro, consultare Registrare e utilizzare cataloghi dati in Athena.
-
Scegli S3 - Apache Hive metastore (Metastore Apache Hive - S3) per interrogare set di dati in Amazon S3 che utilizzano un metastore Apache Hive. Per ulteriori informazioni su questa opzione, consulta Connessione di Athena a un metastore Apache Hive.
-
Scegli Custom or shared connector (Connettore personalizzato o condiviso) se desideri creare un connettore origine dati personalizzato da utilizzare con Athena. Per informazioni sulla scrittura di un connettore origine dati, consulta Sviluppare un connettore di origine dati utilizzando l'SDK di Athena Query Federation.
-
Scegli Next (Successivo).
-
Nella pagina Inserisci i dettagli dell'origine dati, per Nome origine dati, inserisci il nome che desideri utilizzare nelle istruzioni SQL quando esegui una query sull'origine dati da Athena. Il nome può contenere fino a 127 caratteri e deve essere univoco all'interno dell'account. Non può essere modificato dopo la creazione. I caratteri validi sono a-z, A-z, 0-9, _ (trattino basso), @ (chiocciola) e - (trattino). I nomi
awsdatacatalog,hive,jmxesystemsono riservati ad Athena e non possono essere utilizzati per i nomi delle origini dati. -
Se l'origine dati che scegli si integra con le connessioni AWS Glue.
-
Peri dettagli della connessione AWS Glue, inserire le informazioni richieste. Una connessione contiene le proprietà necessarie per connettersi a una particolare origine dati. Le proprietà richieste cambiano a seconda del tipo di connessione. Per ulteriori informazioni sulle proprietà relative al connettore, consultare Connettori di origine dati disponibili. Per informazioni sulle proprietà di connessione aggiuntive, vedere le proprietà di connessione AWS Glue nella Guida per l'utente AWS Glue.
Nota
-
Quando si aggiornano le proprietà della connessione Glue, è necessario riavviare il connettore Lambda per ottenere le proprietà aggiornate. Per fare ciò, modificare le proprietà dell'ambiente e salvarlo senza modificare nulla.
-
Quando si aggiorna una connessione Glue, le seguenti proprietà non verranno aggiornate automaticamente nella funzione Lambda corrispondente. È necessario aggiornare manualmente la funzione Lambda per queste proprietà.
-
Configurazione VPC Lambda:
security_group_ids,subnet_ids -
Ruolo di esecuzione Lambda:
spill_bucket,secret_name,spill_kms_key_id
-
-
-
In Ruolo IAM esecuzione Lambda, scegliere una delle seguenti opzioni:
-
Crea e usa un nuovo ruolo di esecuzione: (impostazione predefinita) Athena crea un ruolo di esecuzione che utilizzerà quindi per accedere alle risorse in AWS Lambda per tuo conto. Athena richiede questo ruolo per creare un’origine dati federata.
-
Utilizza un ruolo di esecuzione esistente: usare questa opzione per scegliere un ruolo di esecuzione esistente. Per questa opzione, scegliere il ruolo di esecuzione che desideri utilizzare dal menu a discesa Ruolo di esecuzione.
-
-
-
Se l'origine dati scelta non si integra con le connessioni AWS Glue.
-
Per Lambda function (Funzione Lambda), scegli Create Lambda function (Crea funzione Lambda). Nella console AWS Lambda viene visualizzata la pagina della funzione per il connettore scelto. La pagina include informazioni dettagliate sul connettore.
-
Sotto Impostazioni applicazione, leggere la descrizione per ogni impostazione dell'applicazione e quindi inserire i valori corrispondenti alle proprie esigenze.
Le impostazioni dell'applicazione visualizzate variano a seconda del connettore di origini dati. Le impostazioni minime richieste includono:
-
AthenaCatalogName: un nome in minuscolo per la funzione Lambda che indica l'origine dati a cui si rivolge, ad esempio
cloudwatchlogs. -
SpillBucket — Un bucket Amazon S3 nel tuo account per archiviare i dati che superano i limiti delle dimensioni della risposta della funzione Lambda.
Nota
I dati fuoriusciti non vengono riutilizzati nelle esecuzioni successive e possono essere eliminati in modo sicuro. Athena non elimina questi dati al posto tuo. Per gestire questi oggetti, prendi in considerazione l'aggiunta di una policy del ciclo di vita degli oggetti che elimina i dati precedenti dal bucket spill di Amazon S3. Per ulteriori informazioni, consultare Gestione del ciclo di vita dello storage nella Guida per l'utente di Amazon S.
-
-
Seleziona I acknowledge that this app creates custom IAM roles and resource policies (Sono consapevole che questa app crea ruoli IAM personalizzati e policy della risorsa). Per ulteriori informazioni, scegliere il link Info (Informazioni) .
-
Seleziona Deploy (Implementa). Al termine dell'implementazione, la funzione Lambda viene visualizzata nella sezione Resources (Risorse) nella console Lambda.
Dopo aver implementato il connettore origine dati nell'account, puoi connetterlo ad Athena.
-
Torna alla pagina Enter data source details (Inserisci i dettagli dell'origine dati) nella console Athena.
-
Nella sezione Connection details (Dettagli di connessione), scegli l'icona di aggiornamento accanto alla casella di ricerca Select or enter a Lambda function (Seleziona o inserisci una funzione Lambda).
-
Scegli il nome della funzione appena creata nella console Lambda. Viene visualizzato l'ARN della funzione Lambda.
-
-
(Facoltativo) Per Tags (Tag), aggiungi coppie chiave-valore da associare a questa origine dati. Per ulteriori informazioni sui tag, consulta Assegnare tag alle risorse di Athena.
-
Scegli Next (Successivo).
-
Nella pagina Verifica e crea, esamina i dettagli dell’origine dati. Per apportare modifiche, scegliere Modifica
-
Leggere le informazioni in Athena creerà risorse nel tuo account. Se si è d'accordo, selezionare Dichiaro di essere consapevole del fatto che Athena creerà risorse per mio conto.
-
Seleziona Create data source (Crea origine dati). Athena creerà per te le seguenti risorse.
-
Ruolo IAM di esecuzione Lambda
-
Connessione AWS Glue (solo se l'origine dati è compatibile con connessioni AWS Glue)
-
Funzione Lambda
-
La sezione Data source details (Dettagli sull'origine dati) della pagina dell'origine dati mostra le informazioni relative al nuovo connettore. È ora possibile utilizzare il connettore nelle query Athena.
Per informazioni sull'utilizzo di connettori dati nelle query, consulta Eseguire query federate.