MongoDB固定集合(capped collection)
一 . 什么是固定集合
MongoDB中有一种特殊类型的集合,值得我们特别留意,那就是固定集合(capped collection)。
固定集合可以声明collection的容量大小,其行为类似于循环队列。数据插入时,新文档会被插入到队列的末尾,如果队列已经被占满,那么最老的文档会被之后插入的文档覆盖。
固定集合特性:固定集合很像环形队列,如果空间不足,最早的文档就会被删除,为新的文档腾出空间。一般来说,固定集合适用于任何想要自动淘汰过期属性的场景。
固定集合应用场景
比如日志文件,聊天记录,通话信息记录等只需保留最近某段时间内的应用场景,都会使用到MongoDB的固定集合。
固定集合的优点
1.写入速度提升。固定集合中的数据被顺序写入磁盘上的固定空间,所以,不会因为其他集合的一些随机性的写操作而“中断”,其写入速度非常快(不建立索引,性能更好)。
2.固定集合会自动覆盖掉最老的文档,因此不需要再配置额外的工作来进行旧文档删除。设置Job进行旧文档的定时删除容易形成性能的压力毛刺。
固定集合非常实用与记录日志等场景。
二 . 固定集合的创建
不同于普通集合,固定集合必须在使用前显式创建。
例如,创建固定集合coll_testcapped,大小限制为1024个字节。
db.createCollection("coll_testcapped",{capped:true,size:1024});
除了大小,创建时还可以指定固定集合中文档的数据量。
例如,创建固定集合coll_testcapped,大小限制为1024个字节,文档数量限制为100。
db.createCollection("coll_testcapped2",{capped:true,size:1024,max:100});
创建固定集合还有另一途径,就是将普通集合装换为固定集合,使用的命令是convertToCapped。
例如将testcol1集合转换为一个大小为1024字节的固定集合:
db.runCommand({"convertToCapped":"testcol1","size":1024})
三 . 固定集合信息的查看
(1)判断集合是否为固定集合,其判定命令为:
db.集合.isCapped()
。
例如判断前面已创建的固定集合coll_testcapped2是否为固定集合:
(2) 从集合信息中获取 有关固定集合的属性,查看集合的指令为:
db.集合.stats()
例如查看集合coll_testcapped2的信息:
四 . 注意事项:
(1) 固定集合创建之后就不可以改变,只能将其删除重建。
(2) 普通集合可以使用convertToCapped转换固定集合,但是固定集合不可以转换为普通集合。
(3) 创建固定集合,为固定集合指定文档数量限制时(指参数max),必须同时指定固定集合的大小(指参数size)。不管先达到哪一个限制,之后插入的新文档都会把最老的文档移除集合。
(4) 使用convertToCapped命令将普通集合转换固定集合时,既有的索引会丢失,需要手动创建。并且,此转换命令没有限制文档数量的参数(即没有max的参数选项)。
(5) 不可以对 固定集合 进行分片。
(6) 对固定集合中的文档可以进行更新(update)操作,但更新不能导致文档的Size增长或缩小,否则更新失败。
假如集合中有一个key,其value 对应的数据长度为100个字节,如果要更新这个key 对应的value,更新后的值也必须为100个字节,大于100个字节不可以,小于100个字节也不可以。
报错信息为:Cannot change the size of a document in a capped collection : XXXX(XXXX代表某个数据字) !=XXXX。
(7) 不可以对固定集合执行删除文档操作,但可以删除整个集合。
删除文档时,报错信息为:cannot remove from a capped collection:XXXX
(8) 还有一定需要注意,对集合估算size时,不要依据集合的storageSize ,而是依据集合的size。storageSize是wiredTiger存储引擎采用高压缩算法压缩后的。
例如通过db.集合.stats()命令查看某集合的数据,"size" 和 "storageSize" 二者相差还是很大的。