您当前的位置: 首页 >  ar

宝哥大数据

暂无认证

  • 1浏览

    0关注

    1029博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

HDP学习--YARN Component Failure

宝哥大数据 发布时间:2016-12-22 23:41:27 ,浏览量:1

一、YARN的故障

  即使完美的软件也会有故障, YARN 是为了减少停机时间,而不是组件故障。 这里写图片描述

二、 YARN Failure Monitoring Communication

  下图显示YARN中故障监控时, 各组件的通信来确保都存活的, 在故障发生时, 每个组件都有中重启机制。 这里写图片描述

三、修改Ambari中的故障检测行为

这里写图片描述

四、ResourceManager的设置检查

为了检查各组件是否存活, 定期巡检, 并处理故障组件。 这里写图片描述

五、NodeManager的检查设置

这里写图片描述

六、Container / Task and ApplicationMaster 的恢复

这里写图片描述

七、NodeManager and ResourceManager 的恢复

这里写图片描述

八、YARN Work-Preserving Restarts

这里写图片描述

YARN Work-Preserving Restarts 相关配置:

这里写图片描述

九、YARN Log Aggregation
  • Enabled by default in HDP 2.3
  • Enables long-term
  • storage of NodeManager logs by storing them in a central location in HDFS -Avoids the need to truncate logs in order to conserve space on a local file system -Provides ability to centrally view log files via a single web UI (the Job History Server)

YARN Log Aggregation 默认配置:

这里写图片描述

十、 知识回顾

这里写图片描述

十一、 总结

这里写图片描述

关注
打赏
1587549273
查看更多评论
立即登录/注册

微信扫码登录

0.0409s