Spark Structured Streaming 实现自定义数据源:
Spark Streaming 查询使用微批处理引擎进行处理,微批处理引擎将 data streams 作为一系列小批处理作业进行处理,从Spark 2.3以来,Spark引入了一种新的低延迟处理模式,称为连续处理,可以实现毫秒级的端到端延迟。
Spark Structured Streaming Demo:
main.scala
package org.apache.spark.sql.structured
import java.util.concurrent.TimeUnit
import org.apache.spark.sql.streaming.{StreamingQuery, Trigger}
import org.apache.spark.sql.{DataFrame, SparkSession}
object Main extends App {
val spark = SparkSession
.builder
.master("local[*]")
.appName("Demo Source (DSv1 / Micro-Batch)")
.getOrCreate
println(s"This is Spark v${spark.version}")
val data: DataFrame = spark
.readStream
.format("org.apache.spark.sql.structured.DemoSourceProvider") //
关注
打赏
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?