摘要: http://blog.csdn.net/v_JULY_v 阅读全文
posted @ 2015-10-27 16:20 贺大卫 阅读(102) 评论(0) 推荐(0) 编辑
摘要: http://xingyunbaijunwei.blog.163.com/blog/static/7653806720111149318357/问题描述 百度面试题: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询... 阅读全文
posted @ 2015-10-27 16:19 贺大卫 阅读(1518) 评论(0) 推荐(0) 编辑
摘要: 我们由一个简单的问题逐步入手:有一个庞大的字符串数组,然后给你一个单独的字符串,让你从这个数组中查找是否有这个字符串并找到它,你会怎么做?有一个方法最简单,老老实实从头查到尾,一个一个比较,直到找到为止,我想只要学过程序设计的人都能把这样一个程序作出来,但要是有程序员把这样的程序交给用户,我只能用无... 阅读全文
posted @ 2015-10-27 16:16 贺大卫 阅读(2027) 评论(0) 推荐(0) 编辑
摘要: http://xingyunbaijunwei.blog.163.com/blog/static/76538067201111494524190/什么是HashHash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定... 阅读全文
posted @ 2015-10-27 16:16 贺大卫 阅读(650) 评论(0) 推荐(0) 编辑
摘要: http://xingyunbaijunwei.blog.163.com/blog/static/765380672011111935145478/1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,... 阅读全文
posted @ 2015-10-27 16:13 贺大卫 阅读(326) 评论(0) 推荐(0) 编辑