2018年3月31日

TOP K和Partition对比

摘要: TOP k算法适用于海量数据,不用一批装入内存。。 partition算法需要全部装入内存排序,需要修改原数据。。 阅读全文

posted @ 2018-03-31 19:55 mdumpling 阅读(180) 评论(0) 推荐(0) 编辑

大数据题目~

摘要: 1.有一个词典,包含N个英文单词,现在任意给一个字符串,设计算法找出包含这个字符串的所有英文单词 比如输入ing词缀,找出形如having,sing,doing等单词; 字符串比较算法(kmp等等),需要一个一个比较。 如果查询多次,可以考虑建立关于字母的倒排索引; 然后取集合交集,考虑字母顺序。 阅读全文

posted @ 2018-03-31 15:09 mdumpling 阅读(173) 评论(0) 推荐(0) 编辑

导航