python之pyautogui实现图片识别-办公自动化
环境
python 3.8
everedit编辑器
代码
from selenium import webdriver from selenium.webdriver.chrome.service import Service import pyautogui #打开浏览器 最大化窗口 s = Service("msedgedriver.exe") driver = webdriver.Edge(service=s) #driver = webdriver.Edge('msedgedriver.exe') driver.get("https://www.baidu.com/") driver.maximize_window() pyautogui.typewrite('python') pyautogui.press('shift') #定位中心位置点击 xy = pyautogui.locateOnScreen('D:/test/baidu.png',confidence=0.5) print (xy) x,y = pyautogui.center(xy) print(x,y) center = pyautogui.center(xy) pyautogui.click(center)
部署
1.安装pyautogui实现鼠标点击、图片识别等操作
2.安装selenium实现对浏览器驱动调用
3.安装opencv-python 实现提高识别准确率,这会大大提高代码执行成功率(我是从0摸索 极少数的情况下 图片才能识别成功 排查花费了我大量的时间)
安装过程中 下载缓慢安装失败 可以重新指向库源 在pip重新安装(https://blog.csdn.net/qq_43006346/article/details/116353126)
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!