Utilizzare Apache Spark in Amazon Athena - Amazon Athena

Utilizzare Apache Spark in Amazon Athena

Amazon Athena facilita l'esecuzione di analisi e l'esplorazione dei dati in modo interattivo mediante Apache Spark senza la necessità di pianificare, configurare o gestire le risorse. Eseguire le applicazioni Apache Spark su Athena significa inviare il codice Spark per l'elaborazione e ricevere direttamente i risultati senza la necessità di configurazioni aggiuntive. Puoi utilizzare l'esperienza semplificata dei notebook nella console Amazon Athena per sviluppare applicazioni Apache Spark utilizzando Python o le API dei notebook Athena. Apache Spark su Amazon Athena è serverless e offre il dimensionamento automatico e on demand per l'elaborazione istantanea, in modo da far fronte ai cambiamenti dei volumi di dati e dei requisiti di elaborazione.

Amazon Athena offre le seguenti funzionalità:

  • Utilizzo della console: invia le tue applicazioni Spark dalla console Amazon Athena.

  • Scripting: crea ed esegui il debug di applicazioni Apache Spark in Python in modo rapido e interattivo.

  • Dimensionamento dinamico: Amazon Athena determina automaticamente le risorse di elaborazione e memoria necessarie per eseguire un processo e dimensiona continuamente tali risorse di conseguenza fino ai massimi specificati. Questo dimensionamento dinamico riduce i costi senza influire sulla velocità.

  • Esperienza del notebook: utilizza l'editor notebook Athena per creare, modificare ed eseguire calcoli utilizzando un'interfaccia familiare. I notebook Athena sono compatibili con i notebook Jupyter e contengono un elenco di celle che vengono eseguite in ordine sotto forma di calcoli. Il contenuto delle celle può includere codice, testo, Markdown, matematica, grafici e rich media.

Per ulteriori informazioni, consultare Eseguire Spark SQL su Amazon Athena Spark ed Esplora il tuo data lake usando Amazon Athena per Apache Spark nel Blog sui Big Data di AWS.