mongodb的ObjectId最后三个字节有趣的地方
ObjectId 由12个字节组成,其中组成如下:
a 4-byte timestamp value, representing the ObjectId’s creation, measured in seconds since the Unix epoch
a 5-byte random value
a 3-byte incrementing counter, initialized to a random value
前4个字节为以秒为单位的时间戳
中间5个字节为随机字符串
最后3个字节是一个随机数,并且递增
3个字节24位,也就是1秒内生成2的24次,即16777216个不重复的ObjectId。
但是请看文档中的描述,incrementing counter, initialized to a random value
当时我看到这里就想,为什么不能从0开始呢,比如某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【000000】
,接着是5ebc0b522d5c8f0c0c【000001】
、5ebc0b522d5c8f0c0c【000002】
... 一直到最大值,然后下一秒,又是从【000000】开始。
因为如果使用随机数,那么有可能某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【fffffe】
,那接下来这一秒还需要生成 ObjectId,岂不是溢出了,不能用了?
后来实验了一下,发现不是我想象的那样。
在 shell 中执行 db.foo.insertOne({ t: "t" })
,发现随机数的递增与时间戳无关,也就是当前连接第一次生成随机数后,后面执行的操作都会使用这个随机数递增,而不会生成另一个随机数。
第一次执行,生成ObjectId如 {这一秒的时间戳}{随机字符串}28c060
下一个ObjectId => {这一秒的时间戳}{随机字符串}28c061
下一个ObjectId => {这一秒的时间戳}{随机字符串}28c062
......
一直到最大值,然后再从 000000 开始算起
所以 mongodb 确实是能在1秒内生成不重复的16777216个ObjectId
注意,随机字符串在同一个 shell 连接中是相同的。
插个题外话:mongodb从3.4版本开始,中间5个字节就已经改为随机字符串了,而不是3个字节表示机器标识码+2个字节表示进程号。至于为什么,官网没说,可以看其他开发者的猜想