tesserocr 安装

tesserocr

tesserocr

介绍：

	tesserocr 是 Python 的一个 OCR 识别库 ，但其实是对 tesseract 做的一 层 Python API 封装，所以它的核心是 tesseract。 
    因此，在安装 tesserocr 之前，我们需要先安装 tesseract 
    
    验证码，可以通过 OCR 技术将其转换成电子文本，然后爬虫将识别的结果提交给服务器，便可以达到自动识别验证码的过程。

windows 安装：

 Windows 下，首先需要下载 tesseract，它为 tesserocr 提供了支持
    
 下载地址： （含 dev : 开发版本不稳定）
	https://digi.bib.uni-mannheim.de/tesseract/
        
 注意：
	安装程序。需要注意的是，需要句选 Additional language data(download）选项来安装 OCR 识别支持的语言包，OCR 便可以识别多国语言

环境配置：

	1.将tesseract安装路径添加到path环境变量中
    
    2. tesseract的语言包添加到环境变量中，在环境变量中新建一个系统变量，变量名称为TESSDATA_PREFIX，tessdata是放置语言包的文件夹，一般在你安装tesseract的目录下，即tesseract的安装目录就是tessdata的父目录

安装：

pip install tesserocr pillow

通过 pip 安装失败，可以尝试 Anaconda 下的 conda 来安装：
	conda install -c simonflueckiger tesserocr pillow

测试：

图片下载：http://images.cnblogs.com/cnblogs_com/Jimc/1316973/o_image.png
    
 tesseract image.png result -l eng 

或：
	import tesserocr
    from PIL import Image

    image = Image.open('image.png')
    result = tesserocr.image_to_text(image)
    print(result)
    
或：
	直接调用 tesserocr 模块的 file_to_text() 方法：
    import tesserocr

	print(tesserocr.file_to_text('image.png'))

posted on 2020-09-30 22:53 晨星_star 阅读(197) 评论(0) 收藏举报

刷新页面返回顶部

tesserocr 安装

tesserocr

介绍：

相关链接：

windows 安装：

环境配置：

安装：

测试：

导航

公告