摘要:
被百度面试官问到这么一个问题: 有五亿个文件文档,另外还有10万个敏感词,怎么判断这五亿个文件里是否有包含敏感词?.......这个我第一念头真不知道怎么办,最后还是问了面试官,面试官告诉我涉及到了一个算法。那就是AC自动机,我通过百度了一批AC自动机的文章,也大概了解到了它的进化历程......关 阅读全文
摘要:
原理介绍(摘自极客时间): Snowflake的核心思想是将64bit的二进制数字分成若干部分,每一部分都存储有特定含义的数据,比如说时间戳、机器ID、序列号等等,最终生成全局唯一的有序ID。它的标准算法是这样的: 从上面这张图中我们可以看到,41位的时间戳大概可以支撑pow(2,41)/1000/ 阅读全文