gogozz

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

python识别图片中的代码。

 在看并发编程网的时候,有些示例代码是以图片的形式出现的,要是此时自己想复制下来的话,只能对着图片敲了,很不爽,于是搜了一下识别图片的网站,有!

把图片上传上去解析,下来txt文本,打开一看,大部分能解析出来,少部分会乱码。

于是搜到下面俩篇博客:

https://blog.csdn.net/FloatDreamed/article/details/79090741

 

https://www.cnblogs.com/jianqingwang/p/6978724.html

 

可以用Python现成的库来解决,我电脑里已经安装了Python3环境,也有pip,开搞。

①安装PIL:pip install Pillow

②安装pytesser3:pip install pytesser3

③安装pytesseract:pip install pytesseract

④安装autopy3:俩个步骤,如下

先安装wheel:pip install wheel

下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl

https://www.lfd.uci.edu/~gohlke/pythonlibs/#autopy,打开该链接下载对应的amd,我是64位的

执行命令:pip install E:\360安全浏览器下载\autopy3-0.51.1-cp36-cp36m-win_amd64.whl(这个路径因人而异)

⑤安装Tesseract-OCR: https://github.com/UB-Mannheim/tesseract/wiki,打开这个链接,点击 tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe ,32位的选w32。

安装exe ,复制tesseract-ocr所在的文件路径,添加到环境变量的path中。

cmd  tesseract -v  有信息出来就是配置环境成功。

直接上Python代码,就几行!

import pytesseract
from PIL import Image

__author__ = 'admin'

im = Image.open(r'C:\Users\zhuang\Desktop\1111.png')
print(pytesseract.image_to_string(im))

解析一看,没有任何乱码! 

posted on   stfzhuang  阅读(1201)  评论(0编辑  收藏  举报

编辑推荐:
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示