第17课:spark streming资源动态申请和动态控制消费速率原理剖析
/* 王家林老师授课http://weibo.com/ilovepains 每天晚上20:00YY频道现场授课频道68917580*/
1 spark streaming资源动态分配 2 spark streaming动态控制消费速率
推荐学习twitter公司heron的开源系统,twitter公司最深使用storm的公司,不用storm了,开发了heron
,意味着storm以后不要用了!heron兼容了storm的一切,storm重新编译一下就可以完全在heron上
跑。所有使用storm的公司就变成了使用heron代码了,延时提高了10倍!
流处理的时代,spark 2.0 有了革命性的变化,参考了storm的想法,spark最大的优势和兄弟框架联手, 但在实时性方面,heron值得关注,heron的开发语言: c++ java(api) python(配置)三种语言。
spark streaming资源动态分配 定时器不断扫描executor的情况,动态就是要么增加,减少executor,如60秒一个任务也没有运行,就将它
remove掉,去掉executor。因为driver schedulebackend数据结构有对executor的引用关系,每次循环遍历
列表,查看资源。
关键代码 ExecutorAllocationManager.scala executor.scheduleAtFixedRate(schedule