阿里大数据云原生化实践，EMR Spark on ACK 产品介绍

阿里云云栖号发布时间：2021-06-07 14:17:31 ，浏览量：1

开源大数据社区 & 阿里云 EMR 系列直播第六期

主题：EMR spark on ACK 产品演示及最佳实践

讲师：石磊，阿里云 EMR 团队技术专家

内容框架：

直播回放：扫描文章底部二维码加入钉群观看回放，或进入链接https://developer.aliyun.com/live/246868

一、云原生化挑战及阿里实践大数据技术发展趋势

云原生化面临挑战

计算与存储分离

如何构建以对象存储为底座的 HCFS 文件系统

shuffle 存算分离

如何解决 ACK 混合异构机型

缓存方案

如何有效支持跨机房、跨专线混合云

ACK 调度

如何解决调度性能瓶颈

其他

阿里实践 - EMR on ACK

整体方案介绍

二、Spark 容器化方案方案介绍

RSS Q&A

1、为什么需要 Remote Shuffle Service？

RSS 使得 Spark 作业不需要 Executor Pod 挂载云盘。挂载云盘非常不利于扩展性和大规模的生产实践。
云盘的大小无法事前确定，大了浪费空间，小了 Shuffle 会失败。RSS 专门为存储计算分离场景设计。
Executor 将 shuffle 数据写入了 RSS 系统，RSS 系统来负责管理 shuffle 数据，Executor 空闲后即可以回收。[SPARK-25299]
可以完美支持动态资源，避免数据倾斜的长尾任务拖住 Executor 资源不能释放。

2、RSS 性能如何，成本如何，扩展性如何？

Spark Shuffle

EMR Remote Shuffle Service

RSS TeraSort Benchmark

备注说明：以10T Terasort 为例，shuffle 量压缩后大约 5.6T。可以看出该量级的作业在 RSS 场景下，由于 shuffle read 变为顺序读，性能会有大幅提升。

Spark on ECI 效果

Summary

原文链接本文为阿里云原创内容，未经允许不得转载。

关注

打赏

1688896170

查看更多评论

[ 申请 ]友情链接：