mongodb的ObjectId最后三个字节有趣的地方

ObjectId 由12个字节组成，其中组成如下：

a 4-byte timestamp value, representing the ObjectId’s creation, measured in seconds since the Unix epoch
a 5-byte random value
a 3-byte incrementing counter, initialized to a random value

前4个字节为以秒为单位的时间戳
中间5个字节为随机字符串
最后3个字节是一个随机数，并且递增

3个字节24位，也就是1秒内生成2的24次，即16777216个不重复的ObjectId。

但是请看文档中的描述，incrementing counter, initialized to a random value

当时我看到这里就想，为什么不能从0开始呢，比如某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【000000】，接着是5ebc0b522d5c8f0c0c【000001】、5ebc0b522d5c8f0c0c【000002】 ... 一直到最大值，然后下一秒，又是从【000000】开始。

因为如果使用随机数，那么有可能某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【fffffe】，那接下来这一秒还需要生成 ObjectId，岂不是溢出了，不能用了？

后来实验了一下，发现不是我想象的那样。

在 shell 中执行 db.foo.insertOne({ t: "t" })，发现随机数的递增与时间戳无关，也就是当前连接第一次生成随机数后，后面执行的操作都会使用这个随机数递增，而不会生成另一个随机数。

第一次执行，生成ObjectId如 {这一秒的时间戳}{随机字符串}28c060
下一个ObjectId => {这一秒的时间戳}{随机字符串}28c061
下一个ObjectId => {这一秒的时间戳}{随机字符串}28c062
......
一直到最大值，然后再从 000000 开始算起

所以 mongodb 确实是能在1秒内生成不重复的16777216个ObjectId

注意，随机字符串在同一个 shell 连接中是相同的。

插个题外话：mongodb从3.4版本开始，中间5个字节就已经改为随机字符串了，而不是3个字节表示机器标识码+2个字节表示进程号。至于为什么，官网没说，可以看其他开发者的猜想

posted on 2021-04-19 23:12 邮差101 阅读(121) 评论(0) 收藏举报

刷新页面返回顶部

guohaoyun

mongodb的ObjectId最后三个字节有趣的地方

导航

公告