第29课:彻底解密Spark 1.6.X以前Shuffle中JVM内存使用及配置内幕详情:Spark到底能够缓存多少数据、Shuffle到底占用了多少数据、磁盘的数据远远比内存小却还是报告内存不足?
本文根据家林大神系列课程编写 http://weibo.com/ilovepains1 JVM内存使用架构剖析2 Spark集群在1.6.x以前中JVM到底可以缓存多少数据?3 spark集群在1.6.x以前中shuffle JVM到底缓存多少数据?4 spark on yarn实际计算对内存的使用案例5 spark1.6.x以前shufflejvm使用配置
1 JVM内存使用架构剖析
JVM 有很多不同的区,最开始的时候,它会通过类装载器把类加载进来,在运行期数据区中有 "本地方法栈","程序计数器","Java 栈"、"Java 堆"和"方法区"以及本地方法接口和它的本地库。从 Spark 的角度来谈代码的运行和数据的处理,主要是谈 Java 堆 (Heap) 空间的运用。
JVM的体现架构:
- 本地方法栈:这个是在迭归的时候肯定是至关重要的;