posts - 101,comments - 5,views - 14万

游标:解决mongo中对海量数据查询oom问题

 

我们要获取某张表中的所有数据时通过findAll方法把所有数据加载到代码内存中,这样就很耗内存导致服务器宕机。所以要获取多有数据可以使用游标来多次遍历获取

游标返回的并不是真实数据,而是指向该数据集合的指针,只有循环迭代游标时才会真正的从数据库中读取真实的数据。正如下边实例中,

FindIterable<Document> findIterable=mongoTemplate.getCollection("yldc-v2-payload").find(query);只是获取的指向数据集的指针,只有在while(cursor.hasNext())遍历时才真正根据游标指针去数据库中获取指针的数据,这样做其实是在循环游标时候逐条获取数据库中真实数据,从而避免造成oom一场,但这样并不能提高查询性能。
复制代码
public void cursorFind(){
        Bson query=new BasicDBObject();
//        Bson query1 = Filters.in("_id",digests);
        MongoCursor<Document> cursor = null;
        int count=0;
        try{
            FindIterable<Document> findIterable=mongoTemplate.getCollection("yldc-v2-payload").find(query);
            cursor = findIterable.iterator();
            while (cursor.hasNext()) {
                Map obj=cursor.next();
                mongoTemplate.save(obj,"env-v2-payload.bak");
                log.info("saving...:{}",count++);
            }
        }catch(Exception e){
            System.out.println("error");
        }
    }
复制代码
  • 设置游标查询不超时
noCursorTimeout(true)

必须设置此属性,防止数据库连接超时,导致的游标连接自动关闭

 

参考:

https://blog.csdn.net/weixin_55891090/article/details/114854236

posted on   colorfulworld  阅读(541)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示