mongoDB聚合操作、多表关联查询（学习笔记）

mongoDB中的聚合是什么

聚合(aggregate)是MongoDB的高级查询语言，它允许我们通过转化合并多个文档的数据来生成新的在单个文档里不存在的文档信息，MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值，求和等)，并返回计算后的数据结果，有点类似sql语句中的 count(*)。

聚合是基于数据处理的聚合管道，每个文档通过一个由多个阶段组成的管道，可以对每个阶段的管道进行分组、过滤等数据处理，输出相应的结果。

语法

MongoDB中聚合的方法使用aggregate()。

db.集合名.aggregate({管道:{表达式}})

常用管道命令

命令	描述
$project	修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
\$match	用于过滤数据，只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit	用来限制MongoDB聚合管道返回的文档数。
$skip	在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind	将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group	将集合中的文档分组，可用于统计结果。
$sort	将输入文档排序后输出。
$geoNear	输出接近某一地理位置的有序文档。
$lookup	连表查询，将被关联集合添加到执行操作的集合中。

常用表达式

$group 用法

db.col.aggregate(
    {$group:{_id:"$orderId",count:{$sum:1}}}
)

其中：

_id 表示分组的依据，按照哪个字段进行分组，需要使用$orderId表示选择这个字段进行分组
\$ sum:1 表示把每条数据作为1进行统计，统计的是该分组下面数据的条数；也可以使用"$quantity"，将quantity字段中的数字进行统计
当_id为null时表示不指定分组的字段，$group会将所有文档分为一组进行统计。

将所有文档中的name的值并放在一个数组中

# 示例：
db.col.aggregate(
    {$group:{_id:null, name:{$push:"$name"}}}
)

# 结果：
{"_id" : null, "name" : ["a", "b", "c", "da", "ea"]}

连续使用\$ group时，在后一个\$ group中使用\$ _id.country获取前一个\$ group查询结果中的country字段

db.col.aggregate(
  {$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
  {$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}}
)

3.4版本新增功能 \$ replaceRoot，用指定的文档替换输入的文档。该操作将替换输入文档中的所有现有字段，包括_id字段。您可以将现有的嵌入式文档升级到顶层
可以与\$ group配合使用，在分组后查询出数据库原文档信息，省去多次使用 \$ first的功夫
可以使用以下聚合查询 \$ \$ ROOT 保持每个名称的整个文档后跟 $replaceRoot 将文档提升到顶部
sql:
db.col.aggregate([
    {"$group":{"_id":"$name","doc":{"$first":"$$ROOT"}}},
    {"$replaceRoot":{"newRoot":"$doc"}}
])
java:
 Aggregation.group("name").first(Aggregation.ROOT).as("doc"),
 Aggregation.replaceRoot("doc")

$match 用法

$match用于进行数据的过滤，是在能够在聚合操作中使用的命令，作用类似于find。

db.col.aggregate(
  {$match:{userid:"a"}}
)

$project 用法

$project用于修改文档的输入输出结构，例如重命名，增加，删除字段

db.col.aggregate(
    {$group:{_id:"$orderId", count:{$sum:1}}},
    {$project:{_id:0, count:1, flag:"flag"}}
)

$unwind 用法

$unwind可以将数组拆分为单独的文档

MongoDB3.2以上版本支持如下语法:

{ 
    $unwind: 
	{
	    #要指定字段路径，在字段名称前加上$符并用引号括起来。 
	    path: <field path>, 

	    #可选,一个新字段的名称用于存放元素的数组索引。该名称不能以$开头。 
	    includeArrayIndex: <string>, 

	    #可选，默认为false。当为true时，如果path所取字段为空，缺少或为空数组，则照常输出文档
	    preserveNullAndEmptyArrays: <boolean> 
	} 
}

示例：

db.col.aggregate(
  {$match:{userid:"a"}},{$unwind:"$tag"} #将tag数组拆分为多个文档
)

# includeArrayIndex选项的示例
db.col.aggregate(
  {
    $match:{userid:"a"}
  }, 
  {
    $unwind:{
      path:"$items", includeArrayIndex: "arrayIndex"
    }
  }
)

\$ sort 、$ skip 和 \$limit 用法

$sort用于将输入的文档排序后输出，-1为降序，1为升序
$limit限制返回数据的条数
$skip 跳过指定的文档数，并返回剩下的文档数
同时使用时先使用skip在使用limit

# 通过userid分组统计，按count进行升序排序，从第二条开始取一条数据返回
db.col.aggregate(
    {$group:{_id:"$userid", count:{$sum:1}}},
    {$sort:{count:1}},
    {$skip:1},
    {$limit:1}
)

\$ lookup 用法

$lookup可以将两个集合关联到一起，有些需求会需要我们对数据库做联表查询操作，我们可以使用$ lookup进行连表查询，通过$ lookup操作符可以对数据库中的集合执行外部集合联接，使用外部集合中的文档以进行处理。