会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
午时的海
博客园
首页
新随笔
联系
订阅
管理
2017年1月20日
多模匹配算法之Aho-Corasick
摘要: 除剔除那些含有敏感词的文本,由于有大量的敏感词,所以通过简单的正则表达式和字符串查找的方式效率太低,每次都有遍历一次字符串。而AC算法的核心思想就是避免不必要的回溯使搜索一直沿着向前的方向,最大可能的减小了时间复杂度,时间复杂度O(N),N为所有的字符串的长度,而且关键字的字数和长度无关。 基本思路
阅读全文
posted @ 2017-01-20 10:26 午时的海
阅读(1012)
评论(0)
推荐(0)
编辑
公告