MongoDB学习笔记——概述
概述
MongoDB是一个跨平台,面向文档的数据库。MongoDB创建的数据库可以实现高可用性,高性能,并且能够轻松拓展。 MongodbDB的运行方式主要给予两个概念:集合(collection)和文档(document)
数据库
数据库就是集合的实际容器
集合
集合就是一组MongoDB文档,相当于关系型数据库的表。
文档
文档就是一组键-值对,类似于JSON对象。文档有着动态的模式,这意味着同一集合内的文档不需要具有同样的字段或结构。
关系型数据库与MongoDB数据库在一些术语上的对比
关系型数据库(mysql) | MongoDB |
数据库 | 数据库 |
表 | 集合(collection) |
行 | 文档(document) |
列 | 字段 |
表Join | 内嵌文档 |
主键 | 主键(ObjectId) |
自动主键(ObjectId):ObjectId是一个24位的字符串,由一组十六进制的字符组成,每个字节两位的十六进制数字,总共用了12字节的存储空间。保障了数据库文档的唯一性!
官方针对ObjectId的规范
- time 时间戳。将刚才生成的objectid的前4位进行提取,然后按照十六进制转为十进制,这个数字就是一个时间戳。
- Machine 机器。接下来的三个字节就是所在主机的唯一标识符,一般是机器主机名的散列值,这样就确保了不同主机生成不同的机器hash值,确保在分布式中不造成冲突,这也就是在同一台机器生成的objectId中间的字符串都是一模一样的原因。
- PID 进程ID。上面的Machine是为了确保在不同机器产生的objectId不冲突,而pid就是为了在同一台机器不同的mongodb进程产生了objectId不冲突,接下来的两位就是产生objectId的进程标识符。
- INC 自增计数器。前面的九个字节是保证了一秒内不同机器不同进程生成objectId不冲突,这后面的三个字节是一个自动增加的计数器,用来确保在同一秒内产生的objectId也不会发现冲突,允许256的3次方等于16777216条记录的唯一性。
private static readonly int __staticMachine = (GetMachineHash() + GetAppDomainId()) & 0x00ffffff; private static readonly short __staticPid = GetPid(); private static int __staticIncrement = (new Random()).Next();
// public static methods /// <summary> /// Generates a new ObjectId with a unique value. /// </summary> /// <returns>An ObjectId.</returns> public static ObjectId GenerateNewId() { return GenerateNewId(GetTimestampFromDateTime(DateTime.UtcNow)); }
/// <summary> /// Generates a new ObjectId with a unique value (with the timestamp component based on a given DateTime). /// </summary> /// <param name="timestamp">The timestamp component (expressed as a DateTime).</param> /// <returns>An ObjectId.</returns> public static ObjectId GenerateNewId(DateTime timestamp) { return GenerateNewId(GetTimestampFromDateTime(timestamp)); }
/// <summary> /// Generates a new ObjectId with a unique value (with the given timestamp). /// </summary> /// <param name="timestamp">The timestamp component.</param> /// <returns>An ObjectId.</returns> public static ObjectId GenerateNewId(int timestamp) { int increment = Interlocked.Increment(ref __staticIncrement) & 0x00ffffff; // only use low order 3 bytes return new ObjectId(timestamp, __staticMachine, __staticPid, increment); } |
MongoDB 支持如下数据类型:
类型 | 描述 | 示例 |
MinKey | BSON包括一个特殊类型,表示可能的最小值。 | mongodb shell不支持 |
Null | 用于创建空值 | {"Key":null} |
Integer | 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 | {"Key":1} |
Double | 双精度浮点值。用于存储浮点值 | {"Key":1.0} |
Symbol | 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。 | |
String | 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的 | {"Key":"stringdata"} |
Object | 用于内嵌文档 | {"Key":{"A":1,"B":"string"}} |
Array | 用于将数组或列表或多个值存储为一个键 | {"Key":[1,2,3]} |
BinData | 二进制数据。用于存储二进制数据 | mongodb shell中无法使用 |
ObjectId | 对象id是文档的12字节的唯一 ID, | {"Key" :ObjectId() } |
Boolean | 布尔值。用于存储布尔值(真/假)。 | {"Key":false} |
Date | 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。 | {"Key" : new Date()} |
Timestamp | 时间戳。记录文档修改或添加的具体时间。 | {"Key":new Timestamp()} |
Regular Expression | 正则表达式类型。用于存储正则表达式 | 采用JavaScript的正则表达式语法:{"Key":/[0-9]{1,2}/} |
MaxKey | BSON包括一个特殊类型,表示可能的最大值。 | mongodb shell不支持 |
注意事项:
- MongoDB不支持表联查(Join)操作,如有相应需求建议通过内嵌文档实现!
- mongodb 是默认区分大小写的,建议mongodb 的表名和字段名都用小写字母命名
- 尽量缩短字段名称的长度,由于MongoDB机制的问题导致每笔数据在存储时都会保存他的Key和Value,这样就造成了大量的数据冗余,对应的存储也占用较大的空间
- 集合中索引总数不能超过64,索引名的长度不能超过125个字符,一个符合索引最多只能有31个