在maven项目中,使用Java代码实现Tesseract_ocr技术非常的简单。只需要引入一个依赖就行。
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.3.1</version>
</dependency>
版本的选择,可以根据自己的需要自行去maven仓库中下载。下面咱们来看代码如何实现。
首先声明我是用idea写的代码。
代码就这么多。
public class Tesseract_ocr {
public static void main(String[] args){
// 图片和语言库的存放路径
String path = "E://com//dream//begin//Tesseract_OCR";
// 图片路径
File file = new File(path + "//image//jpg//bank//1_3.jpg");
System.out.println("本地文件路径:".concat(file.getPath()));
// 创建ITesseract对象
ITesseract instance = new Tesseract();
// 设置训练库的位置
instance.setDatapath(path + "//tessdata");
// 根据需求选择语言库 chi_sim :简体中文, eng
instance.setLanguage("chi_sim");
String result = null;
try {
// 识别开始获取时间戳
long startTime = System.currentTimeMillis();
// 图片识别
result = instance.doOCR(file);
// 识别结束时间戳
long endTime = System.currentTimeMillis();
System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
} catch (TesseractException e) {
e.printStackTrace();
}
// 识别信息
System.out.println("result: ".concat(result));
}
}
希望能帮助大家
限知识有限,如有问题,请纠正。
~~~~~~~~~~可以忽略~~~~~~~~~~~~~
发现一个不错的chatGPT网站,方便易用。