上一页 1 2 3 4 5 6 7 8 9 ··· 13 下一页
摘要: 1 有100W个关键字,长度小于等于50字节。用高效的算法找出top10的热词,并对内存的占用不超过1MB。 提示:老题,与caopengcs讨论后,得出具体思路为: 先把100W个关键字hash映射到小文件,根据题意,100W50B = 5010^6B = 50M,而内存只有1M,故干脆搞一个ha 阅读全文
posted @ 2018-02-02 08:47 jxr041100 阅读(351) 评论(0) 推荐(0) 编辑
摘要: simhash算法 方法介绍 背景 如果某一天,面试官问你如何设计一个比较两篇文章相似度的算法?可能你会回答几个比较传统点的思路: 一种方案是先将两篇文章分别进行分词,得到一系列特征向量,然后计算特征向量之间的距离(可以计算它们之间的欧氏距离、海明距离或者夹角余弦等等),从而通过距离的大小来判断两篇 阅读全文
posted @ 2018-02-02 08:27 jxr041100 阅读(217) 评论(0) 推荐(0) 编辑
摘要: /*Welcome to Facebook! This is just a simple shared plaintext pad, with no execution capabilities. When you know what language you'd like to use for your interview, simply choose it from the dropdo... 阅读全文
posted @ 2018-02-02 06:42 jxr041100 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 从前,在海上有5个海盗,一次他们抢到100颗价值连城的钻石,但如何分配这些钻石成了问题,5个人都很贪婪,且又都极为聪明,于是他们想一出个办法。办法是这样,通过抓阄的方式确定一个从1到5的先后顺序,然后由第1个人提出一个分配方案,如果这个方案获得半数以上的支持,那么就按这个海盗的方案执行,倘只是达到半 阅读全文
posted @ 2018-02-01 15:21 jxr041100 阅读(404) 评论(0) 推荐(0) 编辑
摘要: 方法介绍 什么是Bit-map 所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。 来看一个具体的例子,假设我们要对0-7内的5个元素(4,7,2,5,3)排序(这里假设这些元素没有重复)。 阅读全文
posted @ 2018-02-01 15:19 jxr041100 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 题目描述 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中? 分析与解法 海量数据处理往往会很有趣,有趣在什么地方呢? 空间,available的内存不够,需要反复交换内存 时间,速度太慢不行,毕竟那是海量数据 处理,数据是一次调 阅读全文
posted @ 2018-02-01 15:10 jxr041100 阅读(402) 评论(0) 推荐(0) 编辑
摘要: With 2 pigs, poison killing in 15 minutes, and having 60 minutes, we can find the poison in up to 25 buckets in the following way. Arrange the buckets 阅读全文
posted @ 2018-02-01 14:51 jxr041100 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 1、搜索关键词智能提示suggestion 百度搜索框中,输入“北京”,搜索框下面会以北京为前缀,展示“北京爱情故事”、“北京公交”、“北京医院”等等搜索词,输入“结构之”,会提示“结构之法”,“结构之法 算法之道”等搜索词。 请问,如何设计此系统,使得空间和时间复杂度尽量低。 提示:此题比较开放, 阅读全文
posted @ 2018-02-01 14:21 jxr041100 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 1 五个海盗抢到了100颗宝石,每一颗都一样大小和价值连城。他们决定这么分: 抽签决定自己的号码(1、2、3、4、5) 首先,由1号提出分配方案,然后大家表决,当且仅当超过半数的人同意时,按照他的方案进行分配,否则将被扔进大海喂鲨鱼 如果1号死后,再由2号提出分配方案,然后剩下的4人进行表决,当且仅 阅读全文
posted @ 2018-02-01 14:14 jxr041100 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 概率统计 1 已知有个rand7()的函数,返回1到7随机自然数,让利用这个rand7()构造rand10() 随机1~10。 分析:这题主要考的是对概率的理解。程序关键是要算出rand10,1到10,十个数字出现的考虑都为10%.根据排列组合,连续算两次rand7出现的组合数是7*7=49,这49 阅读全文
posted @ 2018-02-01 14:12 jxr041100 阅读(434) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 13 下一页