tesseract-ocr 安装、语言库、使用 随记
前几日才听说ocr的图片识别功能。觉得很有意思。先体验一下。
地址: GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)
1.下载exe文件进行安装。
2.选择对应版本
3.安装注意
安装过程中选择对应的语言库。感觉这里他们已经做的很好了。
勾选3个chinese(xxx)
4.配置环境
电脑环境的path中配置对应路径。
5.测试环境:
cmd 打开窗口。
用 tesseract -v
6.初使用
cmd 开始
使用命令: tesseract geci.jfif result -l chi_sim
geci.jfif 是图片文件 result 是返回的识别结果文件名称 -l 是选择语言 chi_sim 是简体中文。
demo例子: tesseract demo.png ge -l chi_sim
结束。