随笔分类 -  开放式问题-系统设计

摘要:先来看一下都有哪些题目: 如何从大量的 URL 中找出相同的 URL?(百度) 如何从大量数据中找出高频词?(百度) 如何找出某一天访问百度网站最多的 IP?(百度) 如何在大量的数据中找出不重复的整数?(百度) 如何在大量的数据中判断一个数是否存在?(腾讯) 如何查询最热门的查询串?(腾讯) 如何 阅读全文
posted @ 2020-07-07 11:45 鸭子船长 阅读(490) 评论(1) 推荐(0) 编辑
摘要:作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.csdn.net/v_JULY_v。 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出 阅读全文
posted @ 2020-07-03 12:53 鸭子船长 阅读(229) 评论(0) 推荐(0) 编辑
摘要:昨天面阿里最后栽在一道很常见的海量数据处理上了,也怪之前没专门花时间准备这个问题。今天参考了July的博客,又反思了下自己面试时错误的思路,重新整理为下面的解答过程。 先上July的博客对类似问题的解答思路: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-25 阅读全文
posted @ 2020-06-12 19:38 鸭子船长 阅读(1540) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示