会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
网络爬虫
葵花酱 - 在路上,骑着单车,一抹阳光。
博客园
首页
新随笔
联系
订阅
管理
2015年10月12日
PHP几个几十个G大文件数据统计并且排序处理
摘要: 诸多大互联网公司的面试都会有这么个问题,有个4G的文件,如何用只有1G内存的机器去计算文件中出现次数最多的数字(假设1行是1个数组,例如QQ号 码)。如果这个文件只有4B或者几十兆,那么最简单的办法就是直接读取这个文件后进行分析统计。但是这个是4G的文件,当然也可能是几十G甚至几百G的文 件,这就不...
阅读全文
posted @ 2015-10-12 17:27 网络爬虫
阅读(1922)
评论(0)
推荐(0)
编辑
公告