posts - 347,comments - 31,views - 11万
12 2023 档案
v0.12.0-敏感词/脏词词标签能力进一步增强
摘要:拓展阅读 敏感词工具实现思路 DFA 算法讲解 敏感词库优化流程 java 如何实现开箱即用的敏感词控台服务? 各大平台连敏感词库都没有的吗? v0.10.0-脏词分类标签初步支持 v0.11.0-敏感词新特性:忽略无意义的字符,词标签字典 v0.12.0-敏感词/脏词词标签能力进一步增强 敏感词标 阅读全文
posted @ 2023-12-18 15:56 老马啸西风 阅读(48) 评论(0) 推荐(0) 编辑
sensitive word 敏感词(脏词) 如何忽略无意义的字符?达到更好的过滤效果?
摘要:忽略字符 说明 我们的敏感词一般都是比较连续的,比如 傻帽 那就有大聪明发现,可以在中间加一些字符,比如【傻!@#$帽】跳过检测,但是骂人等攻击力不减。 那么,如何应对这些类似的场景呢? 我们可以指定特殊字符的跳过集合,忽略掉这些无意义的字符即可。 v0.11.0 开始支持 例子 其中 charIg 阅读全文
posted @ 2023-12-09 15:03 老马啸西风 阅读(117) 评论(0) 推荐(0) 编辑
sensitive-word 敏感词/脏词开源工具-v.0.10.0-脏词分类标签支持
摘要:sensitive-word sensitive-word 基于 DFA 算法实现的高性能敏感词工具。 创作目的 实现一款好用敏感词工具。 基于 DFA 算法实现,目前敏感词库内容收录 6W+(源文件 18W+,经过一次删减)。 后期将进行持续优化和补充敏感词库,并进一步提升算法的性能。 希望可以细 阅读全文
posted @ 2023-12-05 19:06 老马啸西风 阅读(402) 评论(0) 推荐(0) 编辑

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

点击右上角即可分享
微信分享提示