图片文字自管理敏感词集成到文章审核中
1、在heima-leadnews-common中创建工具类,封装一下tess4j
package com.heima.common.tess4j; import net.sourceforge.tess4j.Tesseract; import net.sourceforge.tess4j.TesseractException; import java.awt.image.BufferedImage; public class Tess4jClient { private String dataPath; private String language; public String doOCR(BufferedImage image) throws TesseractException { //创建Tesseract对象 Tesseract tesseract = new Tesseract(); //设置字体库路径 tesseract.setDatapath(dataPath); //中文识别 tesseract.setLanguage(language); //执行OCR识别 String result = tesseract.doOCR(image); //替换回车和Tab键,使结果为一行 result = result.replaceAll("\\r/\\n", "-").replaceAll(" ", ""); return result; } }
2、修改审核文章中的图片审核逻辑
将图片敏感词审核集成到图片审核中。
try { for (String image : images) { byte[] bytes = fileStorageService.downLoadFile(image); //byte[] 转换为bufferedImage ByteArrayInputStream in = new ByteArrayInputStream(bytes); BufferedImage bufferedImage = ImageIO.read(in); //图片文字识别 String result = tess4jClient.doOCR(bufferedImage); //过滤文字 boolean isSensitive = handleSensitiveScan(result, wmNews); if(!isSensitive){ return isSensitive; } imageList.add(bytes); } }catch (Exception e){ e.printStackTrace(); }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构