MongoDB 基础概念
简介
MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。
MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组
MongoDB数据存储:(https://www.cnblogs.com/foxracle/p/3421893.html)
mongodb的所有数据实际上是存放在硬盘的,所有要操作的数据通过mmap的方式映射到内存某个区域内。然后mongodb就在这块区域里面进行数据修改,避免了零碎的硬盘操作。至于mmap上的内容flush到硬盘就是操作系统的事情了,所以如果,mongodb在内存中修改了数据,然后mmap数据flush到硬盘之前,系统宕机了,就会丢失数据了。
安装后开启服务 在MongoDB\bin目录下执行mongod -dbpath C:\MongoDB\data\db,
然后在bin目录下另外打开一个cmd 在bin目录下执行mongo命令,之后就能正常使用了!!!
基本概念
在mongodb中基本的概念是文档、集合、数据库
SQL术语/概念 | MongoDB术语/概念 |
---|---|
database | database / 数据库 |
table | collection / 很多文档的集合 |
row | document / 文档 |
column | field / 域(文档中的键) |
index | index / 索引 |
table joins | 表连接,MongoDB不支持 |
primary key | primary key / MongoDB自动将_id字段设置为主键 |
数据库(database)
一个mongodb中可以建立多个数据库。
MongoDB的默认数据库为"db",该数据库存储在data目录中。
MongoDB的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。
-
show dbs 显示所有数据的列表。
-
db 显示当前数据库对象或集合
-
use <dbname> 连接到一个指定的数据库。
有一些数据库名是保留的,可以直接访问这些有特殊作用的数据库。
-
admin: 从权限的角度来看,这是"root"数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
-
local: 这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合
-
config: 当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。
文档(Document)
文档是一组键值对(即 BSON)。MongoDB 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 MongoDB 非常突出的特点。
需要注意的是:
-
文档中的键/值对是有序的。
-
文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
-
MongoDB区分类型和大小写。
-
MongoDB的文档中不能有重复的键。
-
文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
文档键命名规范:
-
键不能含有\0 (空字符)。这个字符用来表示键的结尾。
-
. 和$有特别的意义,只有在特定环境下才能使用。
-
以下划线"_"开头的键是保留的(不是严格要求的)。
集合(collection)
集合就是 MongoDB 文档组,集合存在于数据库中,没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性,当第一个文档插入时,集合就会被创建。
合法的集合名
-
集合名不能是空字符串""。
-
集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
-
集合名不能以"system."开头,这是为系统集合保留的前缀。
-
用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。
capped collections
Capped collections 就是固定大小的collection。它有很高的性能以及队列过期的特性(过期按照插入的顺序),
必须要显式的创建一个capped collection,指定一个 collection 的大小,单位是字节。
由于 Capped collection 是按照文档的插入顺序而不是使用索引确定插入位置,这样的话可以提高增添数据的效率
db.createCollection("mycoll", {capped:true, size:100000})
-
在 capped collection 中,你能添加新的对象。
-
能进行更新,然而,对象不会增加存储空间。如果增加,更新就会失败 。
-
使用 Capped Collection 不能删除一个文档,可以使用 drop() 方法删除 collection 所有的行。
-
删除之后,你必须显式的重新创建这个 collection。
元数据
数据库的信息是存储在集合中。它们使用了系统的命名空间:dbname.system.*
在MongoDB数据库中名字空间 <dbname>.system.* 是包含多种系统信息的特殊集合(Collection),如下:
-
dbname.system.namespaces,列出所有命名空间
-
dbname.system.indexes,列出所有索引
-
dbname.system.profile,包含数据库概要(profile)信息
-
dbname.system.users,列出所有可访问数据库的用户
-
dbname.local.sources,包含复制对端(slave)的服务器信息和状态
修改系统集合中的对象有如下限制:
-
在{{system.indexes}}插入数据,可以创建索引。但除此之外该表信息是不可变的(特殊的drop index命令将自动更新相关信息)。
-
{{system.users}}是可修改的。
-
{{system.profile}}是可删除的。
数据类型
MongoDB中常用的数据类型:
-
String(只能使用UTF-8),Integer,Boolean,Double,Array,Null,Timestamp
-
Date,表示当前距离 Unix新纪元(1970年1月1日)的毫秒数。日期类型是有符号的, 负数表示 1970 年之前的日期
-
Min/Max keys,将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比
-
Object,用于内嵌文档
-
Symbol, 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言
-
Object ID,对象 ID。用于创建文档的 ID,ObjectId 类似唯一主键,可以很快的去生成和排序,包含 12 bytes
-
前 4 个字节表示创建 unix 时间戳
-
接下来的 3 个字节是机器标识码
-
紧接的两个字节由进程 id 组成 PID
-
最后三个字节是随机数
-
MongoDB 中存储的文档必须有一个 _id 键。这个键的值可以是任何类型的,默认是个 ObjectId 对象,由于 ObjectId 中保存了创建的时间戳,所以不需要为文档保存时间戳字段
-
-
Binary Data,二进制数据。用于存储二进制数据
-
Code,代码类型。用于在文档中存储 JavaScript 代码
-
Regular expression,正则表达式类型。用于存储正则表达式
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具