Java实现简单背景的图片文字提取-Tesseract-OCR

// 存储开始用时
long start = System.currentTimeMillis();
//加载要识别的图片
File image = new File(srcpath);
//设置配置文件夹微视、识别语言、识别模式
Tesseract tesseract = new Tesseract();
tesseract.setDatapath("src/main/resources/tessdata");
//设置识别语言为中文简体，（如果要设置为英文可改为"eng"）
tesseract.setLanguage("chi_sim");
//使用 OSD 进行自动页面分割以进行图像处理
tesseract.setPageSegMode(1);
//设置引擎模式是神经网络LSTM引擎
tesseract.setOcrEngineMode(1);
//开始识别整张图片中的文字
String result = tesseract.doOCR(image);
long time = System.currentTimeMillis() - start;
System.out.println("识别结束,耗时：" + time + " 毫秒，识别结果如下：");
System.out.println();
System.out.println(result);

posted @ 2024-04-06 19:10 Lee597 阅读(265) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· Java 调用电脑中安装的tesseract.exe进行图片中的文本方向识别

· java tess4j配置

· 图片文字识别 - OCR

· 图片文字-敏感词过滤

· Java也能做OCR！SpringBoot 整合 Tess4J 实现图片文字识别

阅读排行：
· Manus爆火，是硬核还是营销？
· 终于写完轮子一部分：tcp代理了，记录一下
· 别再用vector＜bool＞了！Google高级工程师：这可能是STL最大的设计失误
· 单元测试从入门到精通
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了

公告

昵称： Lee597
园龄： 3年8个月
粉丝： 0
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

1. 电脑防火墙IP白名单设置(1)

最新评论

1. Re:winform查询数据库
string str = comboBox1.SelectedItem.ToString();里面comboBox1未定义
giao
--芊桦
2. Re:C# 使用timer控件定时关闭MessageBox
参考了

和
--Lee597