会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
刚刚好。
博客园
首页
新随笔
联系
订阅
管理
2023年3月12日
海量数据处理相关问题
摘要: #如何从大量的 URL 中找出相同的 URL? ##题目描述 给定 a、b 两个文件,各存放 50 亿个 URL,每个 URL 各占 64B,内存限制是 4G。请找出 a、b 两个文件共同的 URL。 ##解答思路 ###1. 分治策略 每个 URL 占 64B,那么 50 亿个 URL 占用的空间
阅读全文
posted @ 2023-03-12 21:55 刚刚好。
阅读(33)
评论(0)
推荐(0)
编辑
公告