会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ronghantao
博客园
首页
新随笔
联系
管理
订阅
2019年3月18日
超大文件(1TB)统计访问次数最多的来源IP及访问次数
摘要: 题目解读 1. 文件格式:访问时间,来源IP,响应结果,响应耗时 2. 文件大小:超大规模,TB数量级 解题思路 首先,数据量过大,通过内存计算肯定是不可行的。 考虑采用分治,将大文件切割成小文件,再对小文件分析,找出访问次数最多的,此时将问题转化为:切割小文件算法 具体思路如下: 将1T的文件按照
阅读全文
posted @ 2019-03-18 12:25 ronghantao
阅读(2115)
评论(0)
推荐(0)
编辑
公告