用python 30行代码,搞定一个简单截图调取的百度识字功能
在做一个数据标注过程中人工需要识别文字。
想了想写了一个小脚本,
大致过程这样的。
截图功能写了好久也没写明白,索性直接调用第三方的截图工具了,在采用qq或者微信截图时,截图完成后保存大致保存在剪切板所以直接抽取了剪切板中的文件。
使用 PIL 中ImageGrab获取剪切板文件,并保存在当前目录
1 image = ImageGrab.grabclipboard() 2 s= 'xxx.png' 3 image.save(s)
调用百度图片文字识别接口。取出输出的文字信息,可参考见百度ocr文档文字识别OCR (baidu.com)
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic" f = open(s, 'rb') img = base64.b64encode(f.read()) params = {"image": img} access_token = 'xxx' request_url = request_url + "?access_token=" + access_token headers = {'content-type': 'application/x-www-form-urlencoded'} response = requests.post(request_url, data=params, headers=headers) if response: for i in response.json()['words_result']: print(i['words'])
使用tkinter模块设计一个窗口
# 设置窗口 window = Tk() window.title('qcc_nw0.1') # 设置窗口大小 window.geometry('500x800') # lable标签 l = Label(window, text='识图2.0', bg='green', fg='white', font=('Arial', 12), width=30, height=2) l.pack() # 设置文本输出栏的文本框 E1 = Text(window,width='100',height='100') E1.insert("insert", txt') E1.pack(side=RIGHT) # 定义按钮 img_txt = Button(window, text='识图吗宝贝', font=('Arial', 10), width=15, height=1, command=s) img_txt.pack() window.mainloop()
完成;
看下完成后的效果
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人