MongoDB:详细解释mongodb的高级操作,聚合和游标

前几天总结了mongodb的安装入门、详细解释了增删改查的基本操作,今天再来总结下mongodb更高级的操作,聚合和游标。

一、聚合,mongodb的聚合操作一般分为四种情景,分别是:count、distinct、group、mapReduce

1、count

count最简单,最容易,也是我们最常用的聚合工具,话说最常用的大家都会用,所以对大家都不是问题,所以叫最简单~~奋斗

count
db.person.find()
db.person.count()
db.person.count({"age":40})

2、distinct

顾名思义,指定了谁,谁就不能重合。

db.person.distinct("age")

3、group

group的操作有些小复杂,但是越是复杂的操作,应用起来就越灵活,group的操作本质上相当于一种“key-value”模型。

下面举的例子就是按照age进行group操作,value为对应age的姓名。下面对这些参数介绍一下:

 key:  这个就是分组的key,我们这里是对年龄分组。
 initial: 每组都分享一个”初始化函数“,特别注意:是每一组,比如这个的age=
10的value的list分享一个initial函数,age=40同样也分享一个initial函数。
 $reduce: 这个函数的第一个参数是当前的文档对象,第二个参数是上一次function操作的累计对象,第一次为initial中的{”perosn“:[]}。有多少个文档,

$reduce就会调用多少次。

group

db.person.group({
	"key":{"age":true},
	"initial":{"person":[]},
	"$reduce":function(cur,prev){
	  	prev.person.push(cur.name);
}
})



上面的结果,有时候我们还可能会有其他的需求,例如:

1、过滤掉age<26岁的成员。

2、有时候person的成员太多,我不可能一一查看,所以我想count一下,这样看起来也比较方便。

这在group是非常容易办到的,因为mongodb有两个可选参数:condition 和finalize

condition 是个过滤条件

finalize 是一个方法,每个文章执行完后,都会触发它,可以在这个方法里面加入count。

condition 和 finalize
db.person.group({
	"key":{"age":true},
	"initial":{"person":[]},
	"$reduce":function(cur,prev){
	  	prev.person.push(cur.name);
	},
	"finalize":function(count){
		out.count=out.person.length;
	},
	"condition":{"age":{$gte:10}}
})


4、mapReduce

mapReduce其实是一种编程模型,用在分布式计算中,其中有一个“map”函数,一个”reduce“函数。
1、map:
          这个称为映射函数,里面会调用emit(key,value),集合会按照你指定的key进行映射分组。
2、reduce:
         这个称为简化函数,会对map分组后的数据进行分组简化,注意:在reduce(key,value)中的key就是
 emit中的key,vlaue为emit分组后的emit(value)的集合,这里也就是很多{"count":1}的数组。
3、mapReduce:
          这个就是最后执行的函数了,参数为map,reduce和一些可选参数。具体看图可知:


mapReduce

map
function(){
	emit(this.name,{count:1});
}

reduce
function(key,value){
	var result={count:0};
	for(var i=0;i<value.length;i++){
		result.count += value[i].count;
	}
	return result;
}

db.person.mapReduce(map,reduce,{"out":"collection"})
{
	"result":"collection",
	"timeMillis":15,
	"counts":{
		"input":7,
		"emit":7,
		"reduce":3,
		"output":4
	},
	"ok":1,
}


从图中我们可以看到如下信息:
       result: "存放的集合名“;
       input:传入文档的个数。
       emit:此函数被调用的次数。
       reduce:此函数被调用的次数。
       output:最后返回文档的个数。

二、游标

 mongodb里面的游标有点类似我们说的C#里面延迟执行,比如:
      var list=db.person.find();
    针对这样的操作,list其实并没有获取到person中的文档,而是申明一个“查询结构”,等我们需要的时候通过for或者next()一次性加载过来,然后让游标逐行读取,当我们枚举完了之后,游标销毁,之后我们在通过list获取时,发现没有数据返回了。

游标

var list = db.person.find();

list.forEach(function(x){
	print(x.name);
})


同时,我们也可以查用分页、排序等查询!

这样可以减少不必要的开销

var single=db.person.find().sort({"name":1}).skip(2).limit(2);


好啦,聚合和游标基本就这些,如果有不对的地方敬请指正。

原创文章,转载请注明出处:http://blog.csdn.net/jessonlv

下期会写关于mongodb索引的建立等操作

posted @ 2013-12-20 11:43  jessonlv  阅读(318)  评论(0编辑  收藏  举报