随笔分类 - 算法
摘要:1.入门与量化:https://www.v2ex.com/t/257297
阅读全文
摘要:问题一,判断一个字串的存在与否? 一般常规是使用HashSet. 但是,随着量的增长,性能也线性降低,同时JVM内存使用不断膨胀,最终无法承受,如下图所示: 1.Bloom filter算法 基于bit位数组与Hash functions。这种算法虽然高效,但并非精确,会有一定的误差。对于要求不是很
阅读全文
摘要:1优秀的机器学习项目 http://blog.csdn.net/zkl99999/article/details/51193075 2梯度计算:https://www.cnblogs.com/pinard/p/5970503.html 3.adaboost算法:http://blog.csdn.ne
阅读全文
摘要:可参考:http://winda.blog.51cto.com/55153/1068000 Hamming校验码作用:用于校验通信数据,防止出现错误,并具有一定的纠错功能。 汉明码在传输的消息流中插入验证码,当计算机存储或移动数据时,可能会产生数据位错误,以侦测并更正单一比特错误。由于汉明编码简单,
阅读全文
摘要:LRU,Least recently used[最近最少使用算法],该算法【或变种】被广泛用于缓存管理中,其设计思想是基于:经常被访问的数据在未来一段时间也会被访问,最近最少被访问的数据在未来一段时间内也将不会被访问;因此在缓存空间不足时可将最近最少被访问的数据移除空间。 最初设计很简单,可如下图所
阅读全文
摘要:Boyer-Moore算法的精华是从后向前,取好后缀与坏后缀中的最大移动位移动搜索词,以达到最快速检索的效果。 详情参考:http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html
阅读全文
摘要:KMP算法的精华在于从前往后,逐步循环地向前滑动搜索词,来最大限度地减少重复匹配次数,以达到提高效率的目的。 移动位数=已匹配字符数-最后一个匹配字符所对应搜索词的位置【从1开始】。 更加详细且具体的说明,请参见: http://www.ruanyifeng.com/blog/2013/05/Knu
阅读全文