背景
Snowflake 是 Twitter 内部的一个 ID 生算法,
可以通过一些简单的规则保证在大规模分布式情况下生成唯一的 ID 号码。
其组成为:
第一个 bit 为未使用的符号位。
第二部分由 41 位的时间戳(毫秒)构成,他的取值是当前时间相对于某一时间的偏移量。
第三部分和第四部分的 5 个 bit 位表示数据中心和机器 ID,其能表示的最大值为 2^5 -1 = 31;
最后部分由 12 个 bit 组成,其表示每个工作节点每毫秒生成的序列号 ID,同一毫秒内最多可生成 2^12 -1 即 4095 个 ID。
需要注意的是:
- 在分布式环境中,5 个 bit 位的 datacenter 和 worker 表示最多能部署 31 个数据中心,每个数据中心最多可部署 31 台节点。
41 位的二进制长度最多能表示 2^41 -1 毫秒即 69 年,所以雪花算法最多能正常使用 69 年,为了能最大限度的使用该算法,你应该为其指定一个开始时间。- 由上可知,雪花算法生成的 ID 并不能保证唯一,如当两个不同请求同一时刻进入相同的数据中心的相同节点时,而此时该节点生成的 sequence 又是相同时,就会导致生成的 ID 重复。
- 所以要想使用雪花算法生成唯一的 ID,就需要保证同一节点同一毫秒内生成的序列号是唯一的。基于此,可以有多种方式参考链接2:
RandomSequenceResolver(随机生成)
RedisSequenceResolver (基于 redis psetex 和 incrby 生成)
LaravelSequenceResolver(基于 laravel 生成)
SwooleSequenceResolver(基于 swoole_lock 锁)
不同的提供者只需要保证同一毫秒生成的序列号不同,就能得到唯一的 ID
代码
php实现
id的混淆
- 既然使用的是snowflake方式, 可以使用 原来总结的 进制转换的方式,转换为相应的 字符串表示方式
- 或者是 使用 hashids 现有库,hashids
补充知识
正数的二进制表示方式: 补码和原码相同
负数的二进制表示方式: 以其原码的补码形式表示
正数的补码是其二进制表示,与原码相同。
负数的补码,将其原码除符号位外的所有位取反(0变1,1变0,符号位为1不变)后加1。
-1 ^ (-1 << 4)
就是-1的二进制表示为-1的补码(其值为 位数上全是1, 11111111)
其实等同于: 2的4次方 - 1