【MongoDB详细使用教程】三、高级查询
【MongoDB详细使用教程】一、Mac安装MongoDB
【MongoDB详细使用教程】二、MongoDB基本操作
【MongoDB详细使用教程】三、高级查询
【MongoDB详细使用教程】四、python操作MongoDB
【MongoDB详细使用教程】五、MongoDB的数据库管理
目录
1、使用比较运算符查询
MongoDB | 运算 |
---|---|
$gt | 大于 |
$lt | 小于 |
$gte | 大于等于 |
$lte | 小于等于欧 |
$ne | 不等于 |
db.集合名.find({"键名": {比较运算符1:值1, 比较运算符2:值2} })
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级" }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级" }
> db.students.find({"age": {$lt:19}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
> db.students.find({"age": {$gte:18,$lt:20}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
2、使用关键字查询
2.1、in/not in 关键字
db.集合名.find({"键名": {$in:[值1, 值2, 值3 ...]} })
db.集合名.find({"键名": {$nin:[值1, 值2, 值3 ...]} })
> db.students.find({"age":{$in:[19,18,17]}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
> db.students.find({"age":{$nin:[19,18,17]}})
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级" }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级" }
2.2、size 关键字
对于值为list的字段,可以对list的长度(即list当中值的个数)进行判断来查询。
db.集合名.find({"键名": {$size:n} })
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
# 查找text字段长度为3的数据
> db.students.find({"text":{$size:3}})
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
2.3、exists 关键字
查询 包含/不包含 某个字段的数据
db.集合名.find({"键名": {$exist: true|fase} }) # t、f要小写
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
# 查询包含text字段的数据
> db.students.find({"text":{$exists:true}})
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
# 查询不含text字段的数据
> db.students.find({"text":{$exists:false}})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
2.4、or 关键字
db.集合名.find({$or:[{条件1}, {条件2}, {条件3}...]})
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
# 查询包含text字段或者name=chen的数据
> db.students.find({$or:[{"text":{$exists:true}},{"name":"chen"}]})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
3、模糊查询
db.集合名.find({"键名": js正则表达)
> db.students.find()
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
{ "_id" : ObjectId("5db68d190f98841018f76970"), "name" : "cheng", "age" : 21, "grade" : "四年级" }
# 查询name以che开头的数据
> db.students.find({"name":/che/})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db68d190f98841018f76970"), "name" : "cheng", "age" : 21, "grade" : "四年级" }
4、查询结果排序
db.集合名.find().sort({"键名": 1|-1, "键名": 1|-1...})
1 为升序
-1 为降序
> db.students.find().sort({"name":1, "age":-1})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db68f6c0f98841018f76971"), "name" : "cheng", "age" : 22, "grade" : "五年级" }
{ "_id" : ObjectId("5db68d190f98841018f76970"), "name" : "cheng", "age" : 21, "grade" : "四年级" }
{ "_id" : ObjectId("5db654660f98841018f7696c"), "name" : "ma", "age" : 20, "grade" : "二年级", "text" : [ "女", "副教授", "副处长" ] }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
5、限定返回结果数量
db.集合名.find().limit(n)
db.集合名.find().skip(n) # 跳过n条,返回从n+1k开始的数据
db.集合名.find().skip(n).limit(m) # 跳过n条,返回后面的m条
.limit() 与 .sort()无先后顺序
# 按age正序排列,并返回前两行数据
> db.students.find().limit(2).sort({"age":1})
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
> db.students.find().sort({"age":1}).limit(2)
{ "_id" : ObjectId("5db642b30f98841018f76965"), "name" : "chen", "age" : 18, "grade" : "一年级" }
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
# 查询age第二小和第三小的数据
> db.students.find().skip(1).limit(2).sort({"age":1})
{ "_id" : ObjectId("5db642bc0f98841018f76966"), "name" : "wang", "age" : 19, "grade" : "二年级" }
{ "_id" : ObjectId("5db653920f98841018f7696b"), "name" : "xu", "age" : 20, "grade" : "三年级", "text" : [ "女", "研究员" ] }
6、查询返回结果数量
db.集合名.find().count()
db.集合名.find().skip(n).count(true) # 与skip结合使用时,要加true
> db.students.find({"name":"cheng"}).count()
2
> db.students.find().count()
6
# 不加true就会统计全部数据条目
> db.students.find().skip(2).count()
6
> db.students.find().skip(2).count(true)
4
7、聚合函数aggregate()
7.1、语法
db.集合名.aggregate([
{ 管道1: {表达式1} },
{ 管道1: {表达式1} },
{ 管道1: {表达式1} },
...
])
# 如果只有一个管道则去掉"[]"
在aggregate()函数中,数据会依次通过每个管道进行筛选过滤,因此称其为管道。
7.2、常用管道
管道 | 说明 |
---|---|
$group | 将集合中的文档分组,可用于统计结果 |
$match | 过滤数据,只输出符合条件的文档 |
$project | 修改输入文档的结构,如重命名、增加、删除字段、创建计算结果 |
$sort | 将输入文档排序后输出 |
$limit | 限制聚合管道返回的文档数 |
$skip | 跳过指定数量的文档,并返回余下的文档 |
$unwind | 将数组类型的字段进行拆分 |
7.3、常用聚合函数
只能在$group管道中使用。
分组函数 | 说明 |
---|---|
$sum | 计算总和,$sum:1同count表示计数 |
$avg | 计算平均值 |
$min | 获取最小值 |
$max | 获取最大值 |
$push | 在结果文档中插入值到一个数组中,相当于拼接字段 |
$first | 根据资源文档的排序获取第一个文档数据 |
$last | 根据资源文档的排序获取最后一个文档数据 |
7.4、实例
$group
db.集合名.aggregate(
{$group:
{
_id:'$字段名', 别名:{$聚合函数:'$字段名'}
}
}
根据_id后的字段名进行分组,对聚合函数后的字段名进行聚合运算。
- 如果分组后,要对全部数据进行聚合运算,则 $聚合函数:1,相当于sql中的 count(1)
# 统计男女生人数
db.singer.aggregate(
{$group:
{
_id:'$sex',
count_sex:{$sum:1}
}
}
);
___________________________________
{ "_id" : "女", "count_sex" : 4 }
{ "_id" : "男", "count_sex" : 11 }
$sum:1 的作用是统计数量
$sum:'$字段名' 则是字段值进行累加
- 因为聚合函数只能在group管道中使用,如果要对全部数据进行聚合运算(即不分组),则 _id:null .
# 统计所有人平均年龄
db.singer.aggregate(
{$group:
{
_id:null,
总人数:{$sum:1},
avg_age:{$avg:"$age"},
min_age:{$min:"$age"},
max_age:{$max:"$age"}
}
}
);
_______________________________________________________
{ "_id" : null, "总人数" : 15, "avg_age" : 42.666666666666664, "min_age" : 29, "max_age" : 55 }
这里直接使用中文进行重命名
- 用$push输出分组后的全部值
# 统计男女生人数及男女生名单
db.singer.aggregate(
{$group:
{
_id:"$sex",
人数:{$sum:1},
名单:{$push:"$name"}
}
}
);
________________________________________________________________________________
{ "_id" : "女", "人数" : 4, "名单" : [ "李宇春", "赵丽颖", "黄龄", "王菲" ] }
{ "_id" : "男", "人数" : 11, "名单" : [ "刘德华", "张学友", "黎明", "郭富城", "薛之谦", "周杰伦", "PSY", "杰克逊", "杨坤", "刘欢", "林志炫" ] }
++$push:"$字段名"++ 相当于mysql中的 ++group_concat(字段名)++ 和 oracle中的 ++wmsys.wm_concat(字段名)++
$match
db.集合名.aggregate(
{$match:{"键名":{表达式}}},
);
# 查找age大于40的数据
db.singer.aggregate(
{$match:
{"age":{$gt:40}}
}
);
$unwind
db.集合名.aggregate(
{$unwind:"键名"}
);
$unwind会将值为数组(列表)的字段进行拆分,数组中的每个值都与该行数据的其他字段组成一行新的数据。
> db.singer.find({"name":"刘德华"})
————————————————————————————————
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : [ "爱你一万年", "忘情水", "来生缘", "我不够爱你" ], "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
# 将刘德华的works字段拆分
db.singer.aggregate([
{$match:{"name":"刘德华"}},
{$unwind:"$works"}
]);
——————————————————————————————
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "爱你一万年", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "忘情水", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "来生缘", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
{ "_id" : ObjectId("5db78dcb25fcb93e108d6dcb"), "num" : "1", "name" : "刘德华", "country" : "中国", "sex" : "男", "age" : 55, "score" : 100, "works" : "我不够爱你", "description" : "1961年9月27日出生于中国香港,演员、歌手、作词人、制片人,影视歌多栖发展的代表艺人之一。" }
管道组合应用
# 查询年龄大于30的男女生人数
db.singer.aggregate([
{$match:{"age":{$gt:30}}},
{$group:{_id:"$sex",人数:{$sum:1}}}
]);
————————————————————————————————
{ "_id" : "女", "人数" : 2 }
{ "_id" : "男", "人数" : 11 }
# 查询年龄在30岁以上,年龄第二小和第三小的人
db.singer.aggregate([
{$match:{"age":{$gt:30}}},
{$project:{_id:0,name:1,age:1}},
{$sort:{"age":1}},
{$skip:1},
{$limit:2}
]);
——————————————————————
{ "name" : "薛之谦", "age" : 33 }
{ "name" : "周杰伦", "age" : 37 }
$project用来设定哪些字段显示,哪些不显示,并可以设置字段显示顺序。1为显示,0为不显示。
这里要注意,在$project后面_id字段默认显示,其他字段默认不显示。
8、创建索引
db.集合名.ensureIndex({"键名1":1|-1, "键名2":1|-1})
> db.students.ensureIndex({"name":1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}