Usa il AWS Serverless Application Repository per distribuire un connettore origine dati Hive - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Usa il AWS Serverless Application Repository per distribuire un connettore origine dati Hive

Per distribuire un connettore origine dati Athena per Hive, puoi utilizzare AWS Serverless Application Repository invece di iniziare con la console Athena. Utilizza il AWS Serverless Application Repository per trovare il connettore che desideri utilizzare, fornisci i parametri richiesti dal connettore e quindi implementa il connettore nell'account. Quindi, dopo aver distribuito il connettore, utilizza la console Athena per rendere disponibile l'origine dati ad Athena.

Per utilizzare AWS Serverless Application Repository al fine di distribuire un connettore origine dati per Hive nell'account
  1. Accedere a Console di gestione AWS e aprire Serverless App Repository (Repository app senza server).

  2. Nel pannello di navigazione, scegli Available applications (Applicazioni disponibili).

  3. Seleziona l'opzione Visualizzare le app che creano ruoli IAM personalizzati o policy delle risorse.

  4. Nella casella di ricerca immetti Hive. I connettori visualizzati includono i due seguenti:

    • AthenaHiveMetastoreFunction: file .jar della funzione Uber Lambda.

    • AthenaHiveMetastoreFunctionWithLayer: file .jar del livello Lambda e della funzione Lambda.

    Le due applicazioni hanno la stessa funzionalità e differiscono solo nella loro implementazione. È possibile utilizzarle entrambe per creare una funzione Lambda che connette Athena al metastore Hive.

  5. Scegli il nome del connettore da utilizzare. Questo tutorial utilizza AthenaHiveMetastoreFunction.

    Scegli il nome del connettore dell'origine dati Athena per Hive.
  6. Sotto Impostazioni applicazioni inserisci i parametri per la funzione Lambda.

    • LambdafuncName: fornisci un nome per la funzione. Ad esempio, myHiveMetastore.

    • SpillLocation: specifica una posizione Amazon S3 in questo account per contenere metadati di spillover se la dimensione di risposta della funzione Lambda supera i 4 MB.

    • HMSUris: inserisci l'URI dell'host del metastore Hive che utilizza il protocollo Thrift alla porta 9083. Utilizzo della sintassi thrift://<host_name>:9083.

    • LambdaMemory: specifica un valore compreso tra 128 MB e 3008 MB. Alla funzione Lambda vengono allocati cicli di CPU proporzionali alla quantità di memoria configurata. Il valore di default è 1024.

    • LambdaTimeOut: specifica il tempo massimo consentito di esecuzione della chiamata Lambda in secondi da 1 a 900 (900 secondi è di 15 minuti). Il valore predefinito è 300 secondi (5 minuti).

    • VPCSecurityGroupIds: inserisci un elenco separato da virgole degli ID dei gruppi di sicurezza VPC per il metastore Hive.

    • VPCSubnetIds: inserisci un elenco separato da virgole degli ID di sottorete VPC per il metastore Hive.

  7. Nella parte inferiore destra della pagina Dettagli applicazione seleziona Sono consapevole che questa app crea ruoli IAM personalizzati, quindi scegli Distribuisci.

A questo punto, puoi configurare Athena per utilizzare la funzione Lambda per connetterti al metastore Hive. Per conoscere le fasi della , consulta Configurazione di Athena per l'utilizzo di un connettore Hive Metastore distribuito.