Apache Spark

Apache Spark è un motore di analisi unificato per l'elaborazione di dati su larga scala. Fornisce contenuti di alto livello APIs in Java, Scala, Python e R e un motore ottimizzato che supporta grafici di esecuzione generali. Puoi utilizzare Apache Spark per creare applicazioni di elaborazione di flussi che utilizzano i dati nei tuoi flussi di dati Kinesis.

Per utilizzare i flussi di dati Kinesis utilizzando Apache Spark Structured Streaming, usa il connettore Amazon Kinesis Data Streams. Questo connettore supporta il consumo con Enhanced Fan-Out, che fornisce all'applicazione una velocità di lettura dedicata fino a 2 MB di dati al secondo per shard. Per ulteriori informazioni, vedere Sviluppo di consumatori personalizzati con throughput dedicato (Enhanced Fan-Out).

Per utilizzare i flussi di dati Kinesis utilizzando Spark Streaming, consulta Spark Streaming + Kinesis Integration.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Apache Druid

Databricks