摘要: lexicographically也就是字典顺序,在文本分析和搜索中有不少应用,比如在查询语句的预处理时,可以通过求得lexicographic minimum,类似的查询就可以命中缓存,只在排序的时候考虑一下关键词在文档里的距离。(1)lexicographically smallest permutation 问题从这里看到这个笔试题:You are given an array of n elements [1,2,....n]. For example {3,2,1,6,7,4,5}.Now we create a signature of this array by comparin 阅读全文
posted @ 2013-01-12 22:01 utopiazh 阅读(1003) 评论(0) 推荐(0) 编辑
摘要: 从这里看到新浪微博的一道面试题:给定sina微博的全部用户(1亿以上)和标签(uniq的标签30万左右)的关系, 系统找出共有2个或以上标签的用户对,并给出这些标签是哪些。 阅读全文
posted @ 2013-01-12 20:51 utopiazh 阅读(1875) 评论(1) 推荐(0) 编辑