雪花算法

在分布式场景中,如何生成一个全局的唯一 ID ?由于是通过多台机器并行运算,因此一般的时间戳、UUID 都不是很可靠。为此,Twitter 提出了一种名为 “雪花算法” 的算法来生成分布式全局唯一 ID 的算法

算法介绍

“雪花算法” 生成的 ID 为 \(64\) 位整数,其中,前 \(41\) 位(\(64\) 位整数第一位表示符号位,不作为开始位)表示自选定的日期以来经过的毫秒数。接下来的 \(10\) 位表示当前的计算机 ID,剩下的 \(12\) 位表示每台机器上生成的 ID 序号,具体结构如下所示:

SnowFlake.png

具体实现

实现代码如下:

import java.util.Random;
import java.util.concurrent.ThreadLocalRandom;

public class SnowFlake {
    public static void main(String[] args) {
        Random random = ThreadLocalRandom.current();
        long timStamp = System.currentTimeMillis(); // 系统当前的时间戳
        long machineId = random.nextInt(0, 1024); // 机器 ID
        long seqId = random.nextInt(0, 4096); // 序列 ID,一般都是机器自增而来,这里只是模拟一下

        long snowId = 0;
        snowId |= (timStamp << 22); 
        snowId |= (machineId << 12);
        snowId |= seqId;

        System.out.println("snow id=" + snowId);
    }
}

算法缺点

  • 基于时间戳的方式,由于压缩了时间戳的存储空间,因此时间戳在某些情况下(这并不太可能)可能会出现时间戳重复的问题
  • 最大机器数为 \(1024\),因此某些大型分布式计算可能不适合使用这种算法

参考:

[1] https://zh.wikipedia.org/wiki/雪花算法

posted @ 2022-04-03 09:34  FatalFlower  阅读(148)  评论(0编辑  收藏  举报