摘要:
转自知乎,链接:https://zhuanlan.zhihu.com/p/80039369 数据表介绍 1、学生表 Student(SId,Sname,Sage,Ssex) SId 学生编号,Sname 学生姓名,Sage 出生年月,Ssex 学生性别 2、课程表 Course(CId,Cname, 阅读全文
摘要:
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 来源 算法思想:分而治之+Hash1.IP地址最多有2^32=4G种取值情况,所以不能完全加载到内存中处理; 2.可以考虑采用“分而治之”的思想,按照IP地址的Hash(IP)%1024值(hash映射),把海量IP日志分别存储到1024个小 阅读全文