您当前的位置: 首页 >  ar

段智华

暂无认证

  • 0浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

第217讲:Spark Shuffle中HashShuffleWriter工作机制和源码详解

段智华 发布时间:2017-04-26 20:21:58 ,浏览量:0

第217讲:Spark Shuffle中HashShuffleWriter工作机制和源码详解

家林大神视频笔记记录,欢迎转载。

1,获取shuffleManager

  Spark Stage里面除了最后一个stage,前面都是map级别,图中Stage2里面的任务是ShuffleMapTask,而ShuffleMapTask的runTask方法要从SparkEnv里面找shuffleManager,获取shuffleManager。

override def runTask(context: TaskContext): MapStatus = {
    // Deserialize the RDD using the broadcast variable.
    val deserializeStartTime = System.currentTimeMillis()
    val ser = SparkEnv.get.closureSerializer.newInstance()
    val (rdd, dep) = ser.deserialize[(RDD[_], ShuffleDependency[_, _, _])](
      ByteBuffer.wrap(taskBinary.value), Threa
关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.0564s