摘要:
最近在处理游戏敏感词之类的东西,为了加强屏蔽处理,所以需要过滤掉字符串中的除汉字之外的是其他东西如数字,符号,英文字母等。 首先我查阅资料并写了个函数: 示例:返回输入字符串中汉字的个数: 这个函数的原理是ord($str)&0x80来判断汉字 80对应的二进制代码为1000 0000,最高位为一, 阅读全文
摘要:
本文转自浅析敏感词过滤算法(C++),自己也在其基础上根据自己的情况做了一点修改。 https://blog.csdn.net/u012755940/article/details/51689401?utm_source=app 为了提高查找效率,这里将敏感词用树形结构存储,每个节点有一个map成员 阅读全文
摘要:
最近需要给游戏做一个敏感词新系统,我采用的方法是比较常用的DFA(确定有穷状态机)算 法,先不讲算法,而这种算法的实现需要一个相应的敏感词库。 我拿到了词库后发现词库中大概有8000+个词,其中包括很多重复的,还有很多有着头包含关 系的词; 什么是头包含词呢? 看如下例子: 我们知道在DFA算法读取 阅读全文