Ubuntu 上安装 OCR 扫描软件 gImageReader
gImageReader 是一款开放源码的 OCR(光学字符识别)扫描工具软件,支持 Linux 和 Windows 系统,用户可用来扫描 JPEG,PNG,TIFF,GIFF 或 PDF 文件或者从扫描仪直接导入的文件,并识别字符。
GitHub 地址:https://github.com/manisandro/gImageReader
添加 PPA --> 更新软件源 --> 安装软件:
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt update
sudo apt install gimagereader tesseract-ocr tesseract-ocr-eng tesseract-ocr-chi-sim tesseract-ocr-chi-tra -y
sudo apt install tesseract-ocr-chi-sim-vert tesseract-ocr-chi-tra-vert -y
卸载软件 --> 移除 PPA:
sudo apt remove gimagereader -y
sudo apt install ppa-purge -y
sudo ppa-purge ppa:sandromani/gimagereader
举例: 利用 gImageReader 识别下面两页图片中的字符。
图一:
图二:
操作步骤
- 打开 gImageReader
- 添加上面两页图片
- 识别语言选择 多种语言(Multilingual)=chi_sim+eng
- 依次选择图一图二进行识别
- 复制或保存识别文本
操作结果参照下图:
See also
寻找知识的源头,探索宇宙的奥秘。
知识的存放地址:人的大脑里、书里、互联网上、自然界里。
获取知识的最优路径:精品课程 > 精品书籍 > 官方文档 > 优质文章 > 与人交流(互为补充,构建知识体系)。
内外兼修,形神合一。
posted on 2020-03-28 09:29 keatonlao 阅读(1414) 评论(0) 编辑 收藏 举报