python基于pywinauto实现PC端自动化 python操作微信自动化
一、 pywinauto安装和启动
1.安装:
pip install pywinauto
2.backend选择 和 控件查看工具inspect介绍
我们安装好Pywinauto之后,首先要确定哪种可访问性技术(backend)可以用于我们的应用程序,在windows上受支持的有两种:
-
Win32 API (
backend= "win32"
) 默认的backend -
MS UI Automation (
backend="uia"
)
如果不能确定程序到底适用于那种backend,可以借助于GUI对象检查工具来做,常用的检查工具有Inspect.ex,Spy++ ,下载地址:https://github.com/blackrosezy/gui-inspect-tool
giithub的项目中的inspect好像不行了,可以用下面这个:
链接:https://pan.baidu.com/s/1LHvbcP5NKqSHC7FLSpiTFQ
提取码:p4hm
将inspect左上角的下拉列表中切换到“UI Automation”,然后鼠标点一下你需要测试的程序窗体,inspect就会显示相关信息,如下图所示。说明backend为uia
程序里面的任意一个部位其实都是控件,在inspect的控件树中都可以找到,是一层一层分级别的,可以一个个点开所有控件
2.启动(实例化程序):以微信示例
from pywinauto.application import Application # 常用方式一:连接已有微信进程(进程号在 任务管理器-详细信息 可以查看,项目中一般根据进程名称自动获取) app = Application(backend='uia').connect(process=8948) # 常用方式二:启动微信进程 (注意路径中特殊字符的转义,/和\,不注意有时会出错) app = Application(backend="uia").start(r'C:\Program Files (x86)\Tencent\WeChat\WeChat.exe')
3.Application对象app的常用方法
通过查看pywinauto的源码中application.py文件,可以看到app的所有属性方法,下面列举常用方法:
app.top_window() # 返回应用程序当前顶部窗口,是WindowSpecification对象,可以继续使用对象的方法往下继续查找控件 # eg:如:app.top_window().child_window(title='地址和搜索栏', control_type='Edit') app.window(**kwargs) # 根据筛选条件,返回一个窗口, 是WindowSpecification对象,可以继续适用对象的方法往下继续查找控件 # eg: 微信主界面 app.window(class_name='WeChatMainWndForPC') app.windows(**kwargs) # 根据筛选条件返回一个窗口列表,无条件默认全部,列表项为wrapped对象,可以使用wrapped对象的方法,注意不是WindowSpecification对象 # eg:[<uiawrapper.UIAWrapper - '李渝的早报 - Google Chrome', Pane, -2064264099699444098>] app.kill(soft=False) # 强制关闭 app.cpu_usage() # 返回指定秒数期间的CPU使用率百分比 app.wait_cpu_usage_lower(threshold=2.5, timeout=None, usage_interval=None) # 等待进程CPU使用率百分比小于指定的阈值threshold app.is64bit() # 如果操作的进程是64-bit,返回True
二、控件定位方法和控件可用方法
操作控件需要以下几个步骤:
第一步 实例化要操作的进程:得到的app是Application对象
第二步 选择窗口 :app.window('一个或多个筛选条件') 得到的窗口是WindowSpecification对象
第三步:基于WindowSpecification对象使用其方法再往下查找,定位到具体的控件
第四步:使用控件的方法属性执行我们需要的操作
WindowSpecification源码中有一些自带的方法可以直接使用,也有注释说到:
""" A specification for finding a window or control Windows are resolved when used. You can also wait for existance or non existance of a window .. implicitly document some private functions .. automethod:: __getattribute__ .. automethod:: __getitem__ """
就是说这是一个查找空间或者窗口的规范,可以使用等待机制。
并且该对象中__getattribute__和__getitem__两个魔术方法,隐式地记录一些私有方法
我的理解是我们可以继续往下一层一层的查找,下面一层一层的控件其实是各种各样的wrapper对象,wrapper有很多种是一系列对象,对象源码都在pywinauto源码的controls目录中
以下总结了常用方法,基本可以满足所有场景的操作,如下:
2.1 层级查找控件的方法
# 通过层级查找控件相关方法+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ window(**kwargs) # 用于窗口的查找 child_window(**kwargs) # 可以不管层级的找后代中某个符合条件的元素,最常用 parent() # 返回此元素的父元素,没有参数 children(**kwargs) # 返回符合条件的子元素列表,支持索引,是BaseWrapper对象(或子类) iter_children(**kwargs) # 返回子元素的迭代器,是BaseWrapper对象(或子类) descendants(**kwargs) # 返回符合条件的所有后代元素列表,是BaseWrapper对象(或子类) iter_children(**kwargs) # 符合条件后代元素迭代器,是BaseWrapper对象(或子类)
2.2 kwargs筛选条件
常用的一些筛选条件:
# 这些是常用的 class_name=None, # 类名 class_name_re=None, # 正则匹配类名 title=None, # 控件的标题文字,对应inspect中Name字段 title_re=None, # 正则匹配文字 control_type=None, # 控件类型,inspect界面LocalizedControlType字段的英文名 best_match=None, # 这个有坑,我不喜欢用,下文有讲解 auto_id=None, # 这个也是固定的可以用,inspect界面AutomationId字段,但是很多控件没有这个属性
# 下面这些不常用,基本用不到 parent=None, process=None,# 这个基本不用,每次启动进程都会变化 top_level_only=True, visible_only=True, enabled_only=False, handle=None, ctrl_index=None, found_index=None, predicate_func=None, active_only=False, control_id=None, framework_id=None, backend=None,
2.3 控件可用的方法属性
# 以下几个只支持窗口模式的控件======================================================================= dlg.close() # 关闭界面 dlg.minimize() # 最小化界面 dlg.maximize() # 最大化界面 dlg.restore() # 将窗口恢复为正常大小,比如最小化的让他正常显示在桌面 dlg.get_show_state() # 正常0,最大化1,最小化2 dlg.exists(timeout=None, retry_interval=None) # 判断是否存在 #timeout:等待时间,一般默认5s #retry_interval:timeout内重试时间 dlg.wait(wait_for, timeout=None, retry_interval=None) # 等待窗口处于特定状态 dlg.wait_not(wait_for_not, timeout=None, retry_interval=None) # 等待窗口不处于特定状态,即等待消失 # wait_for/wait_for_not: # * 'exists' means that the window is a valid handle # * 'visible' means that the window is not hidden # * 'enabled' means that the window is not disabled # * 'ready' means that the window is visible and enabled # * 'active' means that the window is active # timeout:等待多久 # retry_interval:timeout内重试时间 # eg: dlg.wait('ready') # 鼠标键盘操作 ===================================================================================== # 我只列举常用形式,他们有很多默认参数但不常用,可以在源码中查看 ctrl.click_input() # 最常用的点击方法,一切点击操作的基本方法(底层调用只是参数不同),左键单击,使用时一般都使用默认不需要带参数 ctrl.right_click_input() # 鼠标右键单击 # 键盘输入,底层还是调用keyboard.send_keys ctrl.type_keys(keys, pause = None, with_spaces = False,) # keys:要输入的文字内容 # pause:每输入一个字符后等待时间,默认0.01就行 # with_spaces:是否保留keys中的所有空格,默认去除0 ctrl.double_click_input(button ="left", coords = (None, None)) # 左键双击 ctrl.press_mouse_input(coords = (None, None)) # 指定坐标按下左键,不传坐标默认左上角 ctrl.release_mouse_input(coords = (None, None)) # 指定坐标释放左键,不传坐标默认左上角 ctrl.move_mouse_input(coords=(0, 0)) # 将鼠标移动到指定坐标,不传坐标默认左上角 ctrl.drag_mouse_input(dst=(0, 0)) # 将ctrl拖动到dst,是press-move-release操作集合 # 控件的常用属性=================================================================================== ctrl.children_texts() # 所有子控件的文字列表,对应inspect中Name字段 ctrl.window_text() # 控件的标题文字,对应inspect中Name字段 # ctrl.element_info.name ctrl.class_name() # 控件的类名,对应inspect中ClassName字段,有些控件没有类名 # ctrl.element_info.class_name ctrl.element_info.control_type # 控件类型,inspect界面LocalizedControlType字段的英文名 ctrl.is_child(parent) # ctrl是否是parent的子控件
ctrl.legacy_properties().get('Value') # 可以获取inspect界面LegacyIAccessible开头的一系列字段,在源码uiawraper.py中找到了这个方法,非常有用
#如某些按钮显示值是我们想要的,但是window_text获取到的是固定文字‘修改群昵称’,这个值才是我们修改后的新名字
# 控件常用操作======================================================================================== ctrl.draw_outline(colour='green') # 空间外围画框,便于查看,支持'red', 'green', 'blue' ctrl.print_control_identifiers(depth=None, filename=None) # 打印其包含的元素,详见打印元素 ctrl.scroll(direction, amount, count=1,) # 滚动 # direction :"up", "down", "left", "right" # amount:"line" or "page" # count:int 滚动次数 ctrl.capture_as_image() # 返回控件的 PIL image对象,可继续使用其方法如下: eg: ctrl.capture_as_image().save(img_path) ret = ctrl.rectangle() # 控件上下左右坐标,(L430, T177, R1490, B941),可.输出上下左右 eg: ret.top=177 ret.bottom=941 ret.left=430 ret.right=1490
三、具体使用举例
第二节中列举了能用到的方法属性,本节列举实际操作中的具体用法
1.对话框dialog选择
根据pywinauto的源码中application.py文件介绍,窗口选择有三种方式:
Once you have an Application instance you can access dialogs in that application either by using one of the methods below. :: dlg = app.YourDialogTitle dlg = app.child_window(title="your title", classname="your class", ...) dlg = app['Your Dialog Title']
以微信主界面窗口为例:
# 微信主界面几种方式: # 这个最好用,下面几种不指名道姓容易出错且速度很慢 dlg1 = app.window(class_name='WeChatMainWndForPC') # 是WindowSpecification对象 # 下面几种方法速度慢,我是不喜欢用 # dlg2_1 = app.Dialog # dlg2_2 = app.微信 # dlg3_1 = app['Dialog'] # dlg3_2 = app['微信']
2.打印元素
我们拿到控件后,是可以将该控件下的所有子控件及其属性以树形结构打印出来的:
# 拿到微信主窗口 win_main_Dialog = app.window(class_name='WeChatMainWndForPC') # 判断是否为dialog,一个微信是一个dialog,就是窗口 print(win_main_Dialog.is_dialog) # 给控件画个红色框便于看出是哪个 win_main_Dialog.draw_outline(colour = 'red') # 打印当前窗口的所有controller(控件和属性) win_main_Dialog. print_control_identifiers(depth=None, filename=None) # 源码内部函数名链式赋值了,都能用,一样的 # print_ctrl_ids = dump_tree = print_control_identifiers
depth:打印的深度,缺省时打印最大深度。
filename:将返回的标识存成文件(生成的文件与当前运行的脚本在同一个路径下)
eg:dlg. print_control_identifiers(filename =’a.txt’)
打印出来的文档树就是inspect中的控件树完全展开的样子,都是有层级的,和微信程序中的各个元素是一一对应的:
3 常用查找方法
# 拿到微信主窗口 win_main_Dialog = app.window(class_name='WeChatMainWndForPC') # 主窗口下的某个窗口,不管层级的找 chat_list = win_main_Dialog.child_window(control_type='List', title='会话') first = chat_list.items()[0] # 第一个聊天项 列表支持items(),支持循环,支持索引 # 详情页修改备注操作 parent()和children()都是只往上或往下查找一个层级,所有满足的放进列表 details_page = win_main_Dialog.child_window(class_name='ContactProfileWnd') # 窗口下的某个窗口 we_id = details_page.child_window(title="微信号:", control_type="Text").parent().children()[1].window_text() # 窗口的爸爸的第二个儿子的文字 alia = details_page.child_window(title="微信号:", control_type="Text").parent().parent().children()[0].children()[0].window_text() edit_btn = details_page.child_window(title="备 注", control_type="Text").parent().children()[1] edit_btn.click_input() btn_modify_name_edit = edit_btn # 先ctrl+a选中所有然后再type_keys替换 btn_modify_name_edit.type_keys('^a').type_keys('备注名字', with_spaces=True) # descendants查找所有后代中满足的,不管层级,所有满足的放进列表 btns_list = win_main_Dialog.child_window(control_type='ToolBar').parent().descendants(control_type='Button') btns_list[0].click_input() dialog.child_window(title="文件名(N):", auto_id="1148", control_type="Edit")
4 快速定位
定位一个元素我们可以一层一层定位,但是这样真就有点笨蛋了,不仅效率低下还不容易适应结构变化,可以先定位某个页面,打印出页面结构,然后基于页面快速定位
def we_name(self): # todo+++++++++++++++++++++++++++++++++++++ try: self._popup = wechat.win_main.child_window(class_name='ContactProfileWnd') self._popup.wait('visible') self._popup.print_control_identifiers(depth=None, filename=None) print(self._popup.Edit.window_text()) # www.pu🤗 print(self._popup.Edit0.window_text()) # www.pu🤗 print(self._popup.Edit1.window_text()) # www.pu🤗 print(self._popup.Edit2.window_text()) # qwer1315458571 print(self._popup.child_window(best_match='微信号:Edit').window_text()) # qwer1315458571 print(self._popup.child_window(best_match='Edit2').window_text()) # qwer1315458571 return self._popup.Edit.window_text() # return self._popup.child_window(title="微信号:", control_type="Text").parent().parent().children()[0].children()[0].window_text() except: return None
四、控件自带的的方法
1. 点击和输入
# 左点击,可以点进源码,还有double_click_input,right_click_input等 edit_btn.click_input() # 先ctrl+a选中所有然后再type_keys替换,和我们选中然后修改一样的 edit_btn.type_keys('^a').type_keys('备注名字', with_spaces=True)
SHIFT + CTRL ^ ALT % 空格键 {SPACE} BACKSPACE {BACKSPACE}、{BS} or {BKSP} BREAK {BREAK} CAPS LOCK {CAPSLOCK} DEL or DELETE {DELETE} or {DEL} DOWN ARROW {DOWN} END {END} ENTER {ENTER} or ~ ESC {ESC} HELP {HELP} HOME {HOME} INS or INSERT {INSERT} or {INS} LEFT ARROW {LEFT} NUM LOCK {NUMLOCK} PAGE DOWN {PGDN} PAGE UP {PGUP} PRINT SCREEN {PRTSC} RIGHT ARROW {RIGHT} SCROLL LOCK {SCROLLLOCK} TAB {TAB} UP ARROW {UP} + {ADD} - {SUBTRACT} * {MULTIPLY} / {DIVIDE}
常规使用很方便,但是有些字符,比如微信中的用户昵称什么的带有表情等特殊符号,用自带的输入方法就会不适用,可以使用keyboard模块(见下)
2.对控件截图并保存
ctrl_qrcode = self.win_login.child_window(title='二维码', control_type='Image') if ctrl_qrcode.exists(): ctrl_qrcode.capture_as_image().save(img_path)
capture_as_image() 方法 返回控件的其实是 PIL image对象,所以可用该方法的属性方法,比如save
3.窗口的等待
窗口加载需要时间,我们又不能一直sleep就需要等待,等待窗口出现或者等待窗口关闭:
save_dialog.wait('ready',timeout=2) save_dialog.close() save_dialog.wait_not('visible') # 'exists':窗口是有效的句柄 # 'visible':窗口未隐藏,常用 # 'enabled':未禁用窗口 # 'ready':窗口可见并启用,常用 # 'active':窗口处于活动状态
4.窗口存在和关闭
self.chatwnd = wechat.app.window(class_name='ChatWnd') if self.chatwnd.exists(): self.chatwnd.close()
5.其他
# 顶层窗口 dlg = app.top_window() # 点方法取值 print(dlg.class_name()) #'WeChatMainWndForPC' # 滚动 常用于页面的滚动,比如好友列表、聊天列表、消息界面 chat_list.scroll(direction='up', amount='page')
五、鼠标操作
pywinauto自带的鼠标操作有些时候并不能完全满足要求,可以调用mouse的方法
导入:
from pywinauto import mouse
常见操作:
# 移动鼠标 mouse.move(coords=(x, y)) # 指定位置,鼠标左击 mouse.click(button='left', coords=(40, 40)) # 鼠标双击 mouse.double_click(button='left', coords=(140, 40)) # 将属性移动到(140,40)坐标处按下 mouse.press(button='left', coords=(140, 40)) # 将鼠标移动到(300,40)坐标处释放, mouse.release(button='left', coords=(300, 40)) # 右键单击指定坐标 mouse.right_click(coords=(400, 400)) # 鼠标中键单击指定坐标(很少用的到) mouse.wheel_click(coords=(400, 400)) # 滚动鼠标 wheel_dist指定鼠标滚轮滑动,正数往上,负数往下。 mouse.scroll(coords=(1200,300),wheel_dist=-3)
示例:
# 以控件中心为起点,滚动 def mouse_scroll(control, distance): rect = control.rectangle() cx = int((rect.left+rect.right)/2) cy = int((rect.top + rect.bottom)/2) mouse.scroll(coords=(cx, cy), wheel_dist=distance) mouse_scroll(control=win_main_Dialog.child_window(control_type='List', title='联系人'), distance=-5)
六、键盘操作
和控件自己的type_keys方法效果一样,但是更快,那个是从前到后啪啪啪的输入,这个是一下就出来了那种
在发送文件和图片的时候可以使用键盘模块,复制粘贴,比啪啪啪输入路径再发送速度快多了
并且该模块可以适配很多表情等特殊符号
import keyboard import io for line in io.StringIO(msg): keyboard.write(line.strip()) # keyboard.send('ctrl+enter') keyboard.write(chat_name) keyboard.send('enter') keyboard.send('ctrl+v')
纯干货,可以说是全网最详细最全面讲解,如果确实帮助到了你,右侧打赏一分或者点个推荐吧~