放逐忧伤

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

有段时间没看书了,记录下这个周末看《MongoDB权威指南》的笔记,目前看到是第四章:查询

Java代码  收藏代码
  1. find({查询条件限定},{返回字段})  

这是一个查询的基本语法,各个签名的作用已经说得很清楚。下面来细细展开:

当然最开始插入一批数据以供测试:

Python代码  收藏代码
  1. db.users.insert({"_id"1"name""aroba""age"22"friends"3})  
  2. db.users.insert({"_id"2"name""brob""age"23"friends"4})  
  3. db.users.insert({"_id"3"name""robin""age"24"friends"23})  
  4. db.users.insert({"_id"4"name""ccrob""age"25"friends"32})  
  5. db.users.insert({"_id"5"name""drobin""age"26"friends"15})  
  6. db.users.insert({"_id"6"name""rrobin""age""az""friends"19})  

 

1、 方法中的第一个参数:查询条件限定是一个document结构,如为{}将默认返回所有数据

Python代码  收藏代码
  1. #查询一个年龄为27的用户:  
  2. db.users.find({"age":23})  
  3. #查询一个年龄为27,姓名为robin的用户,相当于AND  
  4. db.users.find({"age":23"name":"brob"})  

作为文档的查询条件,可以支持更复杂的格式:

Python代码  收藏代码
  1. #查询年龄大于20且小于30的用户  
  2. db.users.find({"age":{"$gt":20"$lte":23}})  

这里条件查询有常用的:小于("$lt")、小于等于("$lte")、大于("$gt")、大于等于("$gte")、不等于("$ne") 。这些条件查询对数字日期类型的字段比较适用

 

前面说到同时查询age和name属性,相当于AND查询。这里来看看OR查询,主要通过"$in"和"$or" 。对单一键有多个值与其匹配的话就用"$in",后面跟一个条件数组。

Python代码  收藏代码
  1. #查询年龄在某个范围的用户:  
  2. db.users.find({"age":{"$in":[202225]}})  

"$in" 对支持的类型非常灵活,不同类型的条件可以同时查询。与之相对应的就是"$nin",表示不在该范围内的键

Python代码  收藏代码
  1. db.users.find({"age":{"$in":[202225"az"]}})  
  2. db.users.find({"age":{"$nin":[202225"az"]}})  

 与单一键的"$in"不同的是,"$or"是包含多个可能条件的数组。

Python代码  收藏代码
  1. #年龄在某个范围内或者name在某个范围内的用户  
  2. db.users.find({"$or": [{"age"23 }, {"name""robin"}]})  
  3. db.users.find({"$or": [{"age": {"$in": [ 234"az" ]} }, {"name""robin"}]})  

 

2、返回字段

作为查询的第二个参数,如果没有的话是默认返回所有字段。可以对需要的返回字段指定:

Python代码  收藏代码
  1. db.users.find({}, {"name":1"age":1})  

1、这个查询会返回name、age、_id字段
2、_id是默认返回,如果不要显示加上("_id":0)     

Python代码  收藏代码
  1. db.users.find({}, {"name":1"age":1"_id":0})  

3、如果某个字段如age不存在,也不抛异常
4、需要显示的字段设置为大于零的数就可以,但还是用1好理解,但如果对不需要显示的字段且不是_id设置为0或其他会抛异常

Python代码  收藏代码
  1. db.users.find({}, {"name":1"age":0"_id":0})  

 这样是不行的,如果不要返回age不加上就可以了

后面还将对数组查询的返回字段做相应的说明,这里就先到此

 

3、几点说明

1、"$not"元条件句,用在其他任何条件上,如

Python代码  收藏代码
  1. #age>20即查询age小于等于20的用户  
  2. db.user.find({"age": {"$not" : {"$gt" :20}}})    
  3. #这里查询age不是1,6,11,16...等的用户  
  4. db.user.find({"age": {"$not": {"$mod": [51]}}})   

 

2、条件查询与更新修改器

Python代码  收藏代码
  1. #更新修改器  
  2. db.users.update({"age"23},{"$set":{"name":"zzzz"}})  
  3. #条件查询  
  4. db.users.find({"age": {"$gt"20}})   

条件句是内层文档键,修改器是外层文档键。而且对同一个字段age来说可以是多个限定条件,但是修改器不能对应多个

 

3、null
如果某个字段的值为null,根据null来查询时可以返回该条文档,但也会返回不包含该字段的文档

Python代码  收藏代码
  1. #新增两条数据  
  2. >db.users.insert{ "_id" : 7"age" : 23"name" : "joe" }  
  3. >db.users.insert{ "_id" : 8"age" : 24"friends" : null, "name" : "sam" }  

 查询键值为null的字段

Python代码  收藏代码
  1. >db.users.find({"friends": null})。  

 这里会返回friends为null的文档,但是也会返回没有该键的文档

 

Shell代码  收藏代码
  1. "_id" : 7"age" : 23"name" : "joe" }  
  2. "_id" : 8"age" : 24"friends" : null, "name" : "sam" }  

 需要通过"$exists"来判定键值是否存在

Shell代码  收藏代码
  1. > db.users.find({"friends":{"$in":[null],"$exists":true}})  
  2. "_id" : 8"age" : 24"friends" : null, "name" : "rrbin" }  

 

4、正则表达式

Shell代码  收藏代码
  1. #这里会返回所有name中包含rob字段的文档  
  2. > db.users.find({"name":/rob/})  
  3. #不仅对字段值进行正则匹配,如果值本身是正则式也匹配  

 

 

4、数组查询

插入几条数据测试

Python代码  收藏代码
  1. db.food.insert({"_id"1"fruit": ["apple""banana""peach"]})  
  2. db.food.insert({"_id"2"fruit": ["apple""orange"]})  
  3. db.food.insert({"_id"3"fruit": ["banana""peach""orange"]})  

以下是一些常用的查询方法,直接上

Python代码  收藏代码
  1. #匹配fruit中包含banana的文档  
  2. db.food.find({"fruit""banana"})  
  3. #必须匹配所有  
  4. db.food.find({"fruit": {"$all" : ["apple""peach"]}})  
  5. #精确匹配  
  6. db.food.find({"fruit": ["apple""orange"]})  
  7. #指定下标 key.index  
  8. db.food.find({"fruit.2""peach"})  
  9. #查询指定长度的数组  
  10. db.food.find({"fruit": {"$size" : 3}})  

但是"$size"操作只能严格匹配,遇到比如要求数组大于或者小于之类的查询就无能为力了。这里提供了解决的方案:对文档新增size字段,每次对数组push或pop操作时,对size字段做相应的增减。查询的时候再对字段size做相应的处理

Python代码  收藏代码
  1. db.food.update({"$push" :{"fruit" : "strawberry"} , "$inc" : {"size" : 1}})  
  2. db.food.find({"size" : {"$gt" : 3}})  

 

返回数组指定子集
"$slice"用于返回数组的一个子集,支持前、后或者偏移

Python代码  收藏代码
  1. db.food.insert({"_id"4"fruit": ["apple""banana""peach""orange""watermelon""lemon""cherry"]})  
  2. #取前2个  
  3. db.food.find({"_id":4}, {"fruit":{"$slice":2}})  
  4. #{u'_id': 4, u'fruit': [u'apple', u'banana']}  
  5. #取后两个  
  6. db.food.find({"_id":4}, {"fruit":{"$slice":-2}})  
  7. #{u'_id': 4, u'fruit': [u'lemon', u'cherry']}  
  8. #从第2个开始取三个,这个其实达到分页的效果,但书中明确指出对大量数据skip性能下降厉害,不建议考虑这种方式  
  9. db.food.find({"_id":4}, {"fruit":{"$slice":[23]}})  
  10. #{u'_id': 4, u'fruit': [u'peach', u'orange', u'watermelon']}  

 使用"$slice"获取数组内的值时,其他的键也会默认返回,如果不需要返回非数组内的其他键这里可以指明,与前面返回不同的是这里可以用0

Python代码  收藏代码
  1. db.food.insert({"_id"5"sum":7"fruit": ["apple""banana""peach""orange""watermelon""lemon"]})  
  2. db.food.find({"_id":5}, {"fruit":{"$slice":[23]}, "_id":0"sum":0})  
  3. {u'fruit': [u'peach', u'orange', u'watermelon']}  

 

5、查询内嵌文档

这里主要考虑匹配查询内嵌文档,考虑如下文档

Python代码  收藏代码
  1. db.users.insert({"_id"9"age":23"name": {"first":"joe""last":"sam"}})  
  2. db.users.insert({"_id"10"age":24"name": {"first":"joe""middle":"dd""last":"sam"}})  

查询名字为joe sam的用户

Python代码  收藏代码
  1. #查询名字为joe sam的用户  
  2. data = db.users.find({"name":{"first":"joe""last":"sam"}})  
  3. #返回第一条,实际上这相当于精确匹配,这个查询条件将严格匹配顺序、字段的数量。其实第二条也是我们想要的结果,那么正确的写法应该是:  
  4. data = db.users.find({"name.first":"joe""name.last":"sam"})  

 书中说到一种复杂情况下的查询:joe发表的5分以上的评论:

Python代码  收藏代码
  1. db.blog.insert({"_id":1"content":"....""comments":[{"name":"joe""score":3"comment":"nice"}, {"name":"sam""score":5"comment":"zzz"}, {"name":"joe""score":5"comment":"good"}]})  
  2. data = db.blog.find({"comments":{"name":"joe""score":{"$gte":5}}})  
  3. #这样是查不到数据的,内嵌文档要求匹配整个文档,而不是comments键  
  4. data = db.blog.find({"comments.name":"joe""comments.score":{"$gte":5}})  
  5. #这个查询会返回这条记录,其实是匹配的commets中各个键,即joe匹配第一条,score匹配第二条  
  6. data = db.blog.find({"comments":{"$elemMatch":{"name":"joe""score":{"$gte":5}}}})  

 

 

6、分页

分页在前面说到"$slice"时,其实是达到分页的效果,前面也说了弊端,这里进一步说明。这里采用limit限制返回结果,slice跳过指定数量文档,sort对查询结果排序

limit
db.users.find().limit(3)结果集超过三条返回三条,不足返回实际数量,貌似对负数不感冒,比如-2还是返回前两条,或者limit里没有偏移这个概念
skip
db.users.find().limit(3)省略结果集前三个,返回剩下的,结果集不足三个就啥都木有了,当然这个也一样,别写负数了,否则抛异常
sort
对结果集排序:1升序,-1降序。可支持多个键/对

Python代码  收藏代码
  1. db.users.find().sort([("name"1), ("age", -1)])  
Shell代码  收藏代码
  1. db.users.find().sort({"name":1,"age":-1})  
Python代码  收藏代码
  1. #这就是分页  
  2. db.users.find().limit(2).sort("_id"1)  
  3. db.users.find().limit(2).skip(2).sort("_id"1)  
  4. db.users.find().limit(2).skip(4).sort("_id"1)  

这对大数据量的skip性能影响较大,这里也提供了一些绕过的方法。比如先取得最后一条的记录的某个唯一键,再查询大于该键的值。可以看出这个限制条件挺多,当然容易想到的采用主键"_id",这是主键必须是数字了

 

 

书中还说到了其他的一些高级特性,如$where、随机获取、包装查询、获取一致性结果等,这里就没记录下来

posted on 2012-05-03 16:12  放逐忧伤  阅读(21804)  评论(0编辑  收藏  举报