摘要: 文章中包含的图片要识别文字,过滤掉图片文字的敏感词 图片文字识别: OCR (Optical Character Recognition,光学字符识别):是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程 Tesse 阅读全文
posted @ 2023-07-03 14:48 佛系粥米 阅读(162) 评论(0) 推荐(0) 编辑
摘要: ①:创建敏感词表,导入资料中wm_sensitive到leadnews_wemedia库中 ②:拷贝对应的wm_sensitive的mapper到项目中 ③:在文章审核的代码中添加自管理敏感词审核 @Autowired private WmSensitiveMapper wmSensitiveMap 阅读全文
posted @ 2023-07-03 14:22 佛系粥米 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 问题:文章审核不能过滤一些敏感词:私人侦探、针孔摄象、信用卡提现、广告代理、刻章办、出售答案、小额贷款… 需要完成的功能:自己维护一套敏感词,在文章审核的时候,需要验证文章是否包含这些敏感词 方案: 1、数据库模糊查询 效率低 2、String.index("")查找 数据库量大的话也是比较慢 3、 阅读全文
posted @ 2023-07-03 11:16 佛系粥米 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 测试:文章发布——文章审核功能是否正常 自媒体前端发布一篇正常的文章:审核成功后,app端的article相关数据是否可以正常保存,自媒体文章状态和app端文章id是否回显。 [遇到的问题:由于自媒体用户发布文章中的写操作写入wmnews表要等整个方法结束后才会提交到数据库,倘若事务提交后在在磁盘上 阅读全文
posted @ 2023-07-03 10:56 佛系粥米 阅读(28) 评论(0) 推荐(0) 编辑