python 仿照小程序
用python 仿写小程序
习惯用QQ 截图工具 ( Ctrl +Alt +A )发现这个工具还不错的,还可以截图识别加提取文字准确率还蛮高的。
分析一波:
截图—> 保存---->识别保存的图片与结果---->存入文档---->…(##$$%^)
识别保存的图片与结果---->存入文档
要用python实现离线识别还要安装几个库(个人喜欢豆瓣镜像源)
pip install pytesseract -i https://pypi.douban.com/simple
好像还需要下载一个tesseract-ocr 这里就特别难下载
要是实在找不到的话我这里也有百度盘
链接:https://pan.baidu.com/s/1GellTu49bg6RE_KmldHzEA
提取码:Pysl
我这里用的是5.0.0的版本,然后自己下了些tessdata语言包,值得注意这里安装好这个后要记得安装路径,要配置环境变量用的
这里建议 去论坛去找些文章看看怎么安装和配置
当这些东西都准备完毕之后我们就可以码了
# -*- coding: utf-8 -*-
# @Author: YangSonglin
# @Email: 1993932965@qq.com
# @Last Modified by: YangSonglin
#文字识别关键库
import datetime
import pytesseract
#图片识取
from PIL import Image
#选择文件库
import tkinter as tk
from tkinter import filedialog
timenow= datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
root = tk.Tk()
root.withdraw()
fileip = filedialog.askopenfilename()
print(fileip)
#进行文件选择将选择出的图片地址给到flieip
img = Image.open(fileip,"r")
text = pytesseract.pytesseract.image_to_string(img,lang='chi_sim')
#定义文档名字与类型
filename = '识别文档.txt'
# a是反复写入 w是覆盖写入
with open(filename,'w') as f:
#写入文档
f.write("\n")
f.write(timenow)
f.write("\n")
f.write("\n")
f.write(text)
f.close();
print(text)
print("识别完成已保存")
这里面有些库的功能不懂就去百度,差不多都有,有的博主都讲的特别详细。不懂就百度十回有九回准。
看成果吧
Python 图片文字提取
我目前只是实现了这个大功能里面的小部分要是有看到,会怎么用python调截图工具的可以评论我
from PIL import ImageGrab
# 参数说明
# 第一个参数 开始截图的x坐标
# 第二个参数 开始截图的y坐标
# 第三个参数 结束截图的x坐标
# 第四个参数 结束截图的y坐标
bbox = (100, 100, 100, 100)
img = ImageGrab.grab(bbox)
# 参数 保存截图文件的路径
im.save('y.png')
我的思路是把鼠标位置记录下来起始位置就可以截取一个框了但是不是太明白有会的评论我或者qq联系我吧,一起加油怎么样?
还是那句话
**注:**本人是一名大一学生还在学习中,过程中可能用到过前辈的东西没注明来处 看到可找我我撤销文章,毕竟第一次写这个玩这个哈哈哈
有兴趣学习的也可私我