最近项目有需求,要对用户的签名,回复进行敏感词检测,然后搜到了一个好用的扩展,分享给大家。
1 | https: //github.com/FireLustre/php-dfa-sensitive |
通过 composer 进行安装:
1 | composer require lustre/php-dfa-sensitive |
然后在 app 目录下创建 Services ,并添加 SensitiveWords.php
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 | <?php namespace App\Services; use DfaFilter\SensitiveHelper; class SensitiveWords { protected static $handle = null; private function __construct() { } private function __clone() { } /** * 获取实例 */ public static function getInstance( $word_path = []) { if (!self:: $handle ) { //默认的一些敏感词库 $default_path = [ storage_path( 'dict/bk.txt' ), storage_path( 'dict/fd.txt' ), storage_path( 'dict/ms.txt' ), storage_path( 'dict/qt.txt' ), storage_path( 'dict/sq.txt' ), storage_path( 'dict/tf.txt' ), ]; $paths = array_merge ( $default_path , $word_path ); self:: $handle = SensitiveHelper::init(); if (! empty ( $paths )) { foreach ( $paths as $path ) { self:: $handle ->setTreeByFile( $path ); } } } return self:: $handle ; } /** * 检测是否含有敏感词 */ public static function isLegal( $content ) { return self::getInstance()->islegal( $content ); } /** * 敏感词过滤 */ public static function replace( $content , $replace_char = '' , $repeat = false, $match_type = 1) { return self::getInstance()->replace( $content , $replace_char , $repeat , $match_type ); } /** * 标记敏感词 */ public static function mark( $content , $start_tag , $end_tag , $match_type = 1) { return self::getInstance()->mark( $content , $start_tag , $end_tag , $match_type ); } /** * 获取文本中的敏感词 */ public static function getBadWord( $content , $match_type = 1, $word_num = 0) { return self::getInstance()->getBadWord( $content , $match_type , $word_num ); } } |
然后我们就可以在项目中,使用 SensitiveWords::getBadWord() 来获取文本中是否有敏感词。
1 2 3 4 | $bad_word = SensitiveWords::getBadWord( $content ); if (! empty ( $bad_word )) { throw new \Exception( '包含敏感词:' . current( $bad_word )); } |
在 storage 目录下创建 dict 目录存放敏感词词库,bk.txt .....等等,这些词库都是我在网上下载的。
下载地址:
1 | https: //download.csdn.net/download/jkko123/12066066 |
版权声明:博主文章,可以不经博主允许随意转载,随意修改,知识是用来传播的。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 字符编码:从基础到乱码解决