摘要: 被百度面试官问到这么一个问题: 有五亿个文件文档,另外还有10万个敏感词,怎么判断这五亿个文件里是否有包含敏感词?.......这个我第一念头真不知道怎么办,最后还是问了面试官,面试官告诉我涉及到了一个算法。那就是AC自动机,我通过百度了一批AC自动机的文章,也大概了解到了它的进化历程......关 阅读全文
posted @ 2020-06-21 21:41 温柔的风 阅读(720) 评论(0) 推荐(0) 编辑
摘要: 原理介绍(摘自极客时间): Snowflake的核心思想是将64bit的二进制数字分成若干部分,每一部分都存储有特定含义的数据,比如说时间戳、机器ID、序列号等等,最终生成全局唯一的有序ID。它的标准算法是这样的: 从上面这张图中我们可以看到,41位的时间戳大概可以支撑pow(2,41)/1000/ 阅读全文
posted @ 2020-06-21 19:04 温柔的风 阅读(3760) 评论(0) 推荐(0) 编辑