用python 30行代码,搞定一个简单截图调取的百度识字功能

在做一个数据标注过程中人工需要识别文字。

想了想写了一个小脚本,

大致过程这样的。

截图功能写了好久也没写明白,索性直接调用第三方的截图工具了,在采用qq或者微信截图时,截图完成后保存大致保存在剪切板所以直接抽取了剪切板中的文件。

使用 PIL 中ImageGrab获取剪切板文件,并保存在当前目录

1 image = ImageGrab.grabclipboard()
2     s= 'xxx.png'
3     image.save(s)

调用百度图片文字识别接口。取出输出的文字信息,可参考见百度ocr文档文字识别OCR (baidu.com)

复制代码
 request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
    f = open(s, 'rb')
    img = base64.b64encode(f.read())
    params = {"image": img}
    access_token = 'xxx'
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/x-www-form-urlencoded'}
    response = requests.post(request_url, data=params, headers=headers)
    if response:
        for i in response.json()['words_result']:
            print(i['words'])
复制代码

使用tkinter模块设计一个窗口

复制代码
# 设置窗口
window = Tk()
window.title('qcc_nw0.1')
# 设置窗口大小
window.geometry('500x800')
# lable标签
l = Label(window, text='识图2.0', bg='green', fg='white', font=('Arial', 12), width=30, height=2)
l.pack()
# 设置文本输出栏的文本框
E1 = Text(window,width='100',height='100')
E1.insert("insert", txt')
            E1.pack(side=RIGHT)
# 定义按钮
img_txt = Button(window, text='识图吗宝贝', font=('Arial', 10), width=15, height=1, command=s)
img_txt.pack()
window.mainloop()
复制代码

完成;

看下完成后的效果

posted @   佟大帅  阅读(926)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示