java读取图片中文字

字库下载参考:https://github.com/tesseract-ocr/tessdata/tree/3.04.00   解压后在项目根目录创建tessdata目录,将内容复制进去。 如图:

 

 

 

测试:

复制代码
 public static void main(String[] args) throws TesseractException {
        ITesseract instance = new Tesseract();

        //如果未将tessdata放在根目录下需要指定绝对路径

        //instance.setDatapath("the absolute path of tessdata");

        //如果需要识别英文之外的语种,需要指定识别语种,并且需要将对应的语言包放进项目中

        instance.setLanguage("chi_sim");

        // 指定识别图片

        File imgDir = new File("D:\\t.jpg");

        long startTime = System.currentTimeMillis();

        String ocrResult = instance.doOCR(imgDir);

        // 输出识别结果

        System.out.println("OCR Result: \n" + ocrResult + "\n 耗时:" + (System.currentTimeMillis() - startTime) + "ms");

    }
复制代码

依赖:

·        <dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>3.2.1</version>
        </dependency    

 

posted @   我没有出家  阅读(1187)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端
点击右上角即可分享
微信分享提示