会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
汇铁
博客园
首页
新随笔
联系
订阅
管理
2015年5月6日
如何在很大数量级的数据中(比如1个亿)筛选出前10万个最小值?之八
摘要: 处理400G数据,用时的估算:1、读一遍:400G/.03G/60/60= 3.7小时。2、写一遍:400G/.01G/60/60= 11.11小时。其中.03、.01,分别是读、写硬盘的速度。验证法中,有将原始数据中已经读出的数据标特殊值的要求。标记方式有二:1、对取出的一亿数循环。用它们在原始数...
阅读全文
posted @ 2015-05-06 10:33 汇铁
阅读(267)
评论(0)
推荐(0)
编辑
公告