分布式ID方案有哪些以及各自的优势
1. 背景
在分布式系统中,经常需要对大量的数据、消息、http请求等进行唯一标识。例如:在分布式系统之间http请求需要唯一标识,调用链路分析的时候需要使用这个唯一标识。这个时候数据自增主键已经不能满足需求,需要一个能够生成全局唯一ID的系统,这个系统需要满足两个需求:
----全局唯一:不能出现重复ID
----高可用:ID生成系统是基础系统,被许多关键系统调用,一旦宕机,会造成严重影响
2. 经典方案介绍
1). UUID
UUID是Universally Unique Identifier的缩写,它是在一定的范围内唯一的机器生成的标识符,UUID是16字节128位长的数字,通常以36字节的字符串表示,比如:3F2504E0-4F89-11D3-9A0C-0305E82C3301。
UUID通过一定的算法机器生成,为了保证UUID的唯一性,规范定义了包括网卡MAC地址、时间戳、名字空间、随机或者伪随机数、时序等元素,以及这些元素生成UUID的算法。UUID的复杂特性保证了其唯一性。
优点:本地生成ID,不需要进行远程调用,时延低,性能高。
缺点:
1)) UUID过长,很多场景不适用,比如用UUID做数据库索引字段。
2)) 没有排序,无法保证趋势递增
2). Flicker方案
只要思路采用了MySQL自增长ID的机制,
#数据表 CREATE TABLE Tickets64( id bigint(20) unsigned NOT NULL auto_increment, stub char(1) NOT NULL default '', PRIMARY KEY(id), UNIQUE KEY stub(stub) )ENGINE=MyISAM; #使用下列SQL读写得到ID号 REPLACE INTO Tickets64 (stub) VALUES('a'); SELECT LAST_INSERT_ID();
replace into 跟 insert 功能类似,不同点在于:replace into 首先尝试插入数据到表中,如果发现表中已经有此行数据(根据主键或者唯-索引判断)则先删除此行数据,然后插入新的数据, 否则直接插入新数据。
优点:充分借助数据库的自增ID机制,可靠性高,生成有序的ID
缺点:
----ID生成性能依赖单台数据库读写性能
----依赖数据库,当数据库异常时整个系统不可用
3). 类snowflake方案
这种方案生成一个64bit的数字,64bit被划分成多个阶段,分别表示时间戳、机器编码、序号。
ID为64bit的long数字,由三部分组成:
----41位的时间序列(精确到毫秒,41位的长度可以使用69年)
----10位的机器标识(10位的长度最多支持部署1024个节点)
----12位的计数顺序号(12位的计数顺序号支持每个姐节点每毫秒产生4096个ID序号)
优点:
----时间戳在高位,自增序列在低位,整个ID是趋势递增的,按照时间有序
----性能高,每秒可生成几百万ID
----可以根据自身业务需求灵活调整bit位划分,满足不同需求
缺点:
----依赖机器时钟,如果机器时钟回拨,会导致重复ID生成。
----在单机上是递增的,但是由于涉及到分布式环境,每台机器上的时钟不可能完全同步,有时候会出现不时全局递增的情况
4). TDDL序列生成方式
TDDL是阿里的分裤分表中间件,它里面包含了全局数据库ID的生成方式,只要思路:
----使用数据库同步ID信息
----每次批量取一定数量的可用ID在内存中,使用完后,再请求数据库重新获取下一批可用ID,每次获取的可用ID数量由步长控制,实际业务中可根据使用速度进行匹配。
----每个业务可以给自己的序列起个唯一的名字,隔离各个业务系统的ID。
优点
----相比flicker方案,大大降低数据库写压力,数据库不再是性能瓶颈。
----相比flicker方案,生成ID性能大幅度提高,因为获取一个可用号段后在内存中直接分配,相对于每次读取数据库性能提高了几个量级
----不同业务不同的ID需求可用seqName字段区分,每个seqName的ID相互隔离,互不影响。
缺点:
----强依赖数据库,当数据库异常时整个系统不可用。
学习并转载自:https://blog.csdn.net/hl_java/article/details/78462283