MongoDB学习笔记~管道中的分组实现group+distinct
mongoDB的管道是个好东西,它可以将很多操作批处理实现,即将多个命令放入一个管道,然后去顺序的执行它们,今天我要说的是,利用管道中的分组来实现实现中的ditinct+group的效果,即先对一个元素去重,然后即一个字段进行分组,如你的userinfoID,它对应多个planID,而我们在planID在表中肯定是重复的,这时,我们需要统计userinfo对应多个种planID,这时问题就来了,尤于planID是重复的,所以分组的结果可能是错误的,它并不是真正意思上的(planID种类),正确的作法应该是先对planID去重复,然后再根据userinfoID去作分组,而这个在大多数的数据库里,是通过多重分组实现的,即选对userinfoID和planID进行分组,然后对结果进行userinfoID的分组,这种就把多于的planID去掉了。
具体作法:
//多分组(group+distinct) db.M_User_Footprints.aggregate([ { $group: { _id: { UserInfoID: "$UserInfoID", ObjID: "$PlayVideo.ObjID" } } }, { $group: { _id: "$_id.UserInfoID", count: { $sum: 1 } } }, { $sort: { "_id": 1 } } ]);
注意,这里的第二个分组用的是第一个分组的_id,所以加上了$_id,这表示使用上面group的数据源来作为第二个分组的键。
而如果只是单个分组,就很容易实现了,也看一下代码
//单分组 db.M_User_Footprints.aggregate([ { $group: { _id: "$UserInfoID", result: { $sum: 1 } } } ])
从上面两段代码我们可以看到,分组键必须用_id,分组的结果名称可以自己定义,{$sum:1}每次自加1。
下面使用map...reduce也可以实现分组的功能
db.runCommand({ mapreduce: "M_User_Footprints", map: function Map() { emit( { "UserInfoID": this.UserInfoID, "ObjID": this.PlayVideo.ObjID } , { count: 1 } ); }, reduce: function Reduce(key, values) { total = 0;//定义一个变量total , values是一个数组 for (var i in values) { total += values[i].count } return { "count": total }; }, finalize: function Finalize(key, reduced) { return reduced; }, out: { inline: 1 } });
分类:
mongoDB
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
2013-06-24 品味人生~咖啡与程序员
2012-06-24 说说设计模式~简单工厂模式(Factory)
2012-06-24 说说设计模式~单件模式(Singleton)
2011-06-24 JS函数的原型及对象,对象方法,对象属性的学习