会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
天下太平
博客园
首页
新随笔
联系
订阅
管理
关键字过滤
关键字过滤
实质:多模式文本匹配问题。
实现方式
编码格式统一为Unicode编码,统一编码差异。
hash存储关键字首字符,快速判定。
存储关键字首字符在vector中的范围下标,提高遍历检索效率。
支持中文规则。
最长匹配原则。
代码实现
https://github.com/TxtpGame/KeyWord/
建议
脏词过滤是个非常繁杂的业务。
建议接第三方服务。
posted @
2022-07-18 14:51
天下太平
阅读(
64
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
公告