- 1. 哈希算法分区的缺点
- 2. 一致性哈希算法
- 2.1 一致性哈希环的概念
- 2.2 将服务器映射到Hash环
- 2.3 数据落入服务器规则
- 2.4 一致性哈希算法分区优缺点
- 2.4.1 优点
- 2.4.2 缺点
虽然哈希算法能做到数据分区,能起到负载均衡+分而治之的作用
缺点:每次扩容缩容,数据和服务器的映射关系都会发生变化,需要将所有数据进行再平衡
2. 一致性哈希算法一致性哈希算法解决了哈希算法的问题。当服务器的数量发生变化,尽量只对部分服务器产生影响
2.1 一致性哈希环的概念一致性Hash算法是对
2
32
2^{32}
232取模,会产生0 ~
2
32
−
1
2^{32}-1
232−1的值,这些值构成一个hash空间。将它们顺序排列且首尾相连,构成一个环形空间(Hash环)
将服务器的IP或主机名作为关键字进行哈希取模,这样每台机器在哈希环上就有一个位置。假如4个服务器节点A、B、C、D,使用IP地址求哈希再取模,再Hash环上的位置如下:
对数据进行哈希取模,这样每台机器在哈希环上就有一个位置。从此位置沿环顺时针“行走”,遇到的第一服务器,就是数据储存目标服务器
假设有Object A、Object B、Object C、Object D四个数据对象,经过哈希取模计算后,在Hash环空间上的位置如下。根据一致性Hash算法分区,数据A会被定位到Node A上,B被定位到Node B上,C被定位到Node C上,D被定位到Node D上
容错性:假设Node C宕机,Object A、B、D不会受到影响,只有Object C被重定位到Node D 扩展性:例如增加一台服务器节点NodeX,X的位置在A和B之间,那受到影响的也就是A到X之间的数据,重新把A到X的数据录入到X上即可供正确读取数据
一致性Hash算法在服务器节点太少时,容易因为节点分布不均匀而造成数据倾斜