概述
分布式系统中,有一些需要使用全局唯一ID
的场景,这种时候为了防止ID
冲突可以使用36位的UUID
,但是UUID
有一些缺点,首先他相对比较长,另外UUID
一般是无序的。有些时候我们希望能使用一种简单一些的ID
,并且希望ID
能够按照时间有序生成。而Twitter
的snowflake
解决了这种需求,最初Twitter
把存储系统从MySQL
迁移到Cassandra
,因为Cassandra
没有顺序ID
生成机制,所以开发了这样一套全局唯一ID
生成服务。
该项目地址为:https://github.com/twitter/snowflake是用Scala
实现的。
结构
snowflake
的结构如下(每部分用-
分开):
0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
第一位为未使用,接下来的41位为毫秒级时间(41位的长度可以使用69年),然后是5位datacenterId
和5位machineId
(10位的长度最多支持部署1024个节点) ,最后12位是毫秒内的计数(12位的计数顺序号支持每个节点每毫秒产生4096个ID
序号)
一共加起来刚好64位,为一个Long
型。(转换成字符串长度为18)
snowflake
生成的ID
整体上按照时间自增排序,并且整个分布式系统内不会产生ID
碰撞(由datacenter
和machineId
作区分),并且效率较高。据说:snowflake
每秒能够产生26万个ID
。
代码
using System;
/// <summary>
/// Twitter的分布式自增ID雪花算法
/// </summary>
public class IdWorker
{
//起始的时间戳
private static long START_STMP = 1480166465631L;
//每一部分占用的位数
private static int SEQUENCE_BIT = 12; //序列号占用的位数
private static int MACHINE_BIT = 5; //机器标识占用的位数
private static int DATACENTER_BIT = 5;//数据中心占用的位数
//每一部分的最大值
private static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT);
private static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT);
private static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT);
//每一部分向左的位移
private static int MACHINE_LEFT = SEQUENCE_BIT;
private static int DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;
private static int TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT;
private long datacenterId = 1; //数据中心
private long machineId = 1; //机器标识
private long sequence = 0L; //序列号
private long lastStmp = -1L;//上一次时间戳
#region 单例:完全懒汉
private static readonly Lazy<IdWorker> lazy = new Lazy<IdWorker>(() => new IdWorker());
public static IdWorker Singleton { get { return lazy.Value; } }
private IdWorker() { }
#endregion
public IdWorker(long cid, long mid)
{
if (cid > MAX_DATACENTER_NUM || cid < 0) throw new Exception($"中心Id应在(0,{MAX_DATACENTER_NUM})之间");
if (mid > MAX_MACHINE_NUM || mid < 0) throw new Exception($"机器Id应在(0,{MAX_MACHINE_NUM})之间");
datacenterId = cid;
machineId = mid;
}
/// <summary>
/// 产生下一个ID
/// </summary>
/// <returns></returns>
public long nextId()
{
long currStmp = getNewstmp();
if (currStmp < lastStmp) throw new Exception("时钟倒退,Id生成失败!");
if (currStmp == lastStmp)
{
//相同毫秒内,序列号自增
sequence = (sequence + 1) & MAX_SEQUENCE;
//同一毫秒的序列数已经达到最大
if (sequence == 0L) currStmp = getNextMill();
}
else
{
//不同毫秒内,序列号置为0
sequence = 0L;
}
lastStmp = currStmp;
return (currStmp - START_STMP) << TIMESTMP_LEFT //时间戳部分
| datacenterId << DATACENTER_LEFT //数据中心部分
| machineId << MACHINE_LEFT //机器标识部分
| sequence; //序列号部分
}
private long getNextMill()
{
long mill = getNewstmp();
while (mill <= lastStmp)
{
mill = getNewstmp();
}
return mill;
}
private long getNewstmp()
{
return (long)(DateTime.UtcNow - new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds;
}
}
使用
IdWorker idworker = IdWorker.Singleton;
Console.WriteLine(idworker.nextId());
测试
两种测试方法,均为500并发,生成5000个Id:
- Machine1() 模拟1台主机,单例模式获取实例
- Machine5() 模拟5台主机,创建5个实例
static void Main(string[] args)
{
//Machine1();
Machine5();
Console.ReadLine();
}
static void Machine1()
{
for (int j = 0; j < 500; j++)
{
Task.Run(() =>
{
IdWorker idworker = IdWorker.Singleton;
for (int i = 0; i < 10; i++)
{
Console.WriteLine(idworker.nextId());
}
});
}
}
static void Machine5()
{
List<IdWorker> workers = new List<IdWorker>();
Random random = new Random();
for (int i = 0; i < 5; i++)
{
workers.Add(new IdWorker(1, i + 1));
}
for (int j = 0; j < 500; j++)
{
Task.Run(() =>
{
for (int i = 0; i < 10; i++)
{
int mid = random.Next(0, 5);
Console.WriteLine(workers[mid].nextId());
}
});
}
}