java读取图片中文字
字库下载参考:https://github.com/tesseract-ocr/tessdata/tree/3.04.00 解压后在项目根目录创建tessdata目录,将内容复制进去。 如图:
测试:
public static void main(String[] args) throws TesseractException { ITesseract instance = new Tesseract(); //如果未将tessdata放在根目录下需要指定绝对路径 //instance.setDatapath("the absolute path of tessdata"); //如果需要识别英文之外的语种,需要指定识别语种,并且需要将对应的语言包放进项目中 instance.setLanguage("chi_sim"); // 指定识别图片 File imgDir = new File("D:\\t.jpg"); long startTime = System.currentTimeMillis(); String ocrResult = instance.doOCR(imgDir); // 输出识别结果 System.out.println("OCR Result: \n" + ocrResult + "\n 耗时:" + (System.currentTimeMillis() - startTime) + "ms"); }
依赖:
· <dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>3.2.1</version> </dependency
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端