python基于pywinauto实现PC端自动化 python操作微信自动化

一、 pywinauto安装和启动

1.安装:

pip install pywinauto

2.backend选择 和 控件查看工具inspect介绍

我们安装好Pywinauto之后,首先要确定哪种可访问性技术(backend)可以用于我们的应用程序,在windows上受支持的有两种:

  • Win32 API (backend= "win32") 默认的backend

  • MS UI Automation (backend="uia")

如果不能确定程序到底适用于那种backend,可以借助于GUI对象检查工具来做,常用的检查工具有Inspect.exSpy++ ,下载地址:https://github.com/blackrosezy/gui-inspect-tool

giithub的项目中的inspect好像不行了,可以用下面这个:

链接:https://pan.baidu.com/s/1LHvbcP5NKqSHC7FLSpiTFQ
提取码:p4hm

将inspect左上角的下拉列表中切换到“UI Automation”,然后鼠标点一下你需要测试的程序窗体,inspect就会显示相关信息,如下图所示。说明backend为uia

 程序里面的任意一个部位其实都是控件,在inspect的控件树中都可以找到,是一层一层分级别的,可以一个个点开所有控件

2.启动(实例化程序):以微信示例

from pywinauto.application import Application
# 常用方式一:连接已有微信进程(进程号在 任务管理器-详细信息 可以查看,项目中一般根据进程名称自动获取)
app = Application(backend='uia').connect(process=8948)
# 常用方式二:启动微信进程 (注意路径中特殊字符的转义,/和\,不注意有时会出错)
app = Application(backend="uia").start(r'C:\Program Files (x86)\Tencent\WeChat\WeChat.exe') 

3.Application对象app的常用方法

通过查看pywinauto的源码中application.py文件,可以看到app的所有属性方法,下面列举常用方法:

app.top_window()
# 返回应用程序当前顶部窗口,是WindowSpecification对象,可以继续使用对象的方法往下继续查找控件
# eg:如:app.top_window().child_window(title='地址和搜索栏', control_type='Edit')

app.window(**kwargs)
# 根据筛选条件,返回一个窗口, 是WindowSpecification对象,可以继续适用对象的方法往下继续查找控件
# eg: 微信主界面 app.window(class_name='WeChatMainWndForPC')

app.windows(**kwargs)
# 根据筛选条件返回一个窗口列表,无条件默认全部,列表项为wrapped对象,可以使用wrapped对象的方法,注意不是WindowSpecification对象
# eg:[<uiawrapper.UIAWrapper - '李渝的早报 - Google Chrome', Pane, -2064264099699444098>]

app.kill(soft=False) # 强制关闭
app.cpu_usage() # 返回指定秒数期间的CPU使用率百分比
app.wait_cpu_usage_lower(threshold=2.5, timeout=None, usage_interval=None) # 等待进程CPU使用率百分比小于指定的阈值threshold
app.is64bit() # 如果操作的进程是64-bit,返回True

二、控件定位方法和控件可用方法

操作控件需要以下几个步骤: 

第一步 实例化要操作的进程:得到的app是Application对象

第二步 选择窗口 :app.window('一个或多个筛选条件') 得到的窗口是WindowSpecification对象

第三步:基于WindowSpecification对象使用其方法再往下查找,定位到具体的控件

第四步:使用控件的方法属性执行我们需要的操作

WindowSpecification源码中有一些自带的方法可以直接使用,也有注释说到:

    """
    A specification for finding a window or control

    Windows are resolved when used.
    You can also wait for existance or non existance of a window

    .. implicitly document some private functions
    .. automethod:: __getattribute__
    .. automethod:: __getitem__
    """
WindowSpecification 说明

就是说这是一个查找空间或者窗口的规范,可以使用等待机制。

并且该对象中__getattribute__和__getitem__两个魔术方法,隐式地记录一些私有方法

我的理解是我们可以继续往下一层一层的查找,下面一层一层的控件其实是各种各样的wrapper对象,wrapper有很多种是一系列对象,对象源码都在pywinauto源码的controls目录中

以下总结了常用方法,基本可以满足所有场景的操作,如下:

2.1 层级查找控件的方法

# 通过层级查找控件相关方法+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
window(**kwargs) # 用于窗口的查找
child_window(**kwargs) # 可以不管层级的找后代中某个符合条件的元素,最常用
parent() # 返回此元素的父元素,没有参数
children(**kwargs) # 返回符合条件的子元素列表,支持索引,是BaseWrapper对象(或子类)
iter_children(**kwargs) # 返回子元素的迭代器,是BaseWrapper对象(或子类)
descendants(**kwargs) # 返回符合条件的所有后代元素列表,是BaseWrapper对象(或子类)
iter_children(**kwargs) # 符合条件后代元素迭代器,是BaseWrapper对象(或子类)

2.2 kwargs筛选条件

常用的一些筛选条件:

# 这些是常用的
class_name=None, # 类名
class_name_re=None, # 正则匹配类名
title=None, # 控件的标题文字,对应inspect中Name字段
title_re=None, # 正则匹配文字
control_type=None, # 控件类型,inspect界面LocalizedControlType字段的英文名
best_match=None, # 这个有坑,我不喜欢用,下文有讲解
auto_id=None, # 这个也是固定的可以用,inspect界面AutomationId字段,但是很多控件没有这个属性
# 下面这些不常用,基本用不到
parent=None,
process=None,# 这个基本不用,每次启动进程都会变化
top_level_only=True,
visible_only=True,
enabled_only=False,
handle=None,
ctrl_index=None,
found_index=None,
predicate_func=None,
active_only=False,
control_id=None,
framework_id=None,
backend=None,
源码中有我没用过的条件

2.3 控件可用的方法属性

# 以下几个只支持窗口模式的控件=======================================================================
dlg.close() # 关闭界面
dlg.minimize() # 最小化界面
dlg.maximize() # 最大化界面
dlg.restore() # 将窗口恢复为正常大小,比如最小化的让他正常显示在桌面
dlg.get_show_state() # 正常0,最大化1,最小化2

dlg.exists(timeout=None, retry_interval=None) # 判断是否存在
    #timeout:等待时间,一般默认5s
    #retry_interval:timeout内重试时间
dlg.wait(wait_for, timeout=None, retry_interval=None) # 等待窗口处于特定状态
dlg.wait_not(wait_for_not, timeout=None, retry_interval=None) # 等待窗口不处于特定状态,即等待消失
    # wait_for/wait_for_not:
    # * 'exists' means that the window is a valid handle
    # * 'visible' means that the window is not hidden
    # * 'enabled' means that the window is not disabled
    # * 'ready' means that the window is visible and enabled
    # * 'active' means that the window is active
    # timeout:等待多久
    # retry_interval:timeout内重试时间
    # eg: dlg.wait('ready')

# 鼠标键盘操作 =====================================================================================
# 我只列举常用形式,他们有很多默认参数但不常用,可以在源码中查看
ctrl.click_input() # 最常用的点击方法,一切点击操作的基本方法(底层调用只是参数不同),左键单击,使用时一般都使用默认不需要带参数
ctrl.right_click_input() # 鼠标右键单击
# 键盘输入,底层还是调用keyboard.send_keys
ctrl.type_keys(keys, pause = None, with_spaces = False,)
    # keys:要输入的文字内容
    # pause:每输入一个字符后等待时间,默认0.01就行
    # with_spaces:是否保留keys中的所有空格,默认去除0
ctrl.double_click_input(button ="left", coords = (None, None)) # 左键双击
ctrl.press_mouse_input(coords = (None, None)) # 指定坐标按下左键,不传坐标默认左上角
ctrl.release_mouse_input(coords = (None, None)) # 指定坐标释放左键,不传坐标默认左上角
ctrl.move_mouse_input(coords=(0, 0)) # 将鼠标移动到指定坐标,不传坐标默认左上角
ctrl.drag_mouse_input(dst=(0, 0)) # 将ctrl拖动到dst,是press-move-release操作集合

# 控件的常用属性===================================================================================
ctrl.children_texts() # 所有子控件的文字列表,对应inspect中Name字段
ctrl.window_text() # 控件的标题文字,对应inspect中Name字段
# ctrl.element_info.name
ctrl.class_name() # 控件的类名,对应inspect中ClassName字段,有些控件没有类名
# ctrl.element_info.class_name
ctrl.element_info.control_type # 控件类型,inspect界面LocalizedControlType字段的英文名
ctrl.is_child(parent) # ctrl是否是parent的子控件
ctrl.legacy_properties().get('Value') # 可以获取inspect界面LegacyIAccessible开头的一系列字段,在源码uiawraper.py中找到了这个方法,非常有用
#如某些按钮显示值是我们想要的,但是window_text获取到的是固定文字‘修改群昵称’,这个值才是我们修改后的新名字
# 控件常用操作======================================================================================== ctrl.draw_outline(colour='green') # 空间外围画框,便于查看,支持'red', 'green', 'blue' ctrl.print_control_identifiers(depth=None, filename=None) # 打印其包含的元素,详见打印元素 ctrl.scroll(direction, amount, count=1,) # 滚动 # direction :"up", "down", "left", "right" # amount:"line" or "page" # count:int 滚动次数 ctrl.capture_as_image() # 返回控件的 PIL image对象,可继续使用其方法如下: eg: ctrl.capture_as_image().save(img_path) ret = ctrl.rectangle() # 控件上下左右坐标,(L430, T177, R1490, B941),可.输出上下左右 eg: ret.top=177 ret.bottom=941 ret.left=430 ret.right=1490

三、具体使用举例

第二节中列举了能用到的方法属性,本节列举实际操作中的具体用法

1.对话框dialog选择

根据pywinauto的源码中application.py文件介绍,窗口选择有三种方式:

Once you have an Application instance you can access dialogs in that
application either by using one of the methods below. ::

   dlg = app.YourDialogTitle
   dlg = app.child_window(title="your title", classname="your class", ...)
   dlg = app['Your Dialog Title']
View Code

以微信主界面窗口为例:

# 微信主界面几种方式:
# 这个最好用,下面几种不指名道姓容易出错且速度很慢
dlg1 = app.window(class_name='WeChatMainWndForPC') # 是WindowSpecification对象
# 下面几种方法速度慢,我是不喜欢用
# dlg2_1 = app.Dialog
# dlg2_2 = app.微信
# dlg3_1 = app['Dialog']
# dlg3_2 = app['微信']

2.打印元素

我们拿到控件后,是可以将该控件下的所有子控件及其属性以树形结构打印出来的:

# 拿到微信主窗口
win_main_Dialog = app.window(class_name='WeChatMainWndForPC')

# 判断是否为dialog,一个微信是一个dialog,就是窗口
print(win_main_Dialog.is_dialog)

# 给控件画个红色框便于看出是哪个
win_main_Dialog.draw_outline(colour = 'red')

# 打印当前窗口的所有controller(控件和属性)
win_main_Dialog. print_control_identifiers(depth=None, filename=None)
# 源码内部函数名链式赋值了,都能用,一样的
# print_ctrl_ids = dump_tree = print_control_identifiers

depth:打印的深度,缺省时打印最大深度。
filename:将返回的标识存成文件(生成的文件与当前运行的脚本在同一个路径下)
eg:dlg. print_control_identifiers(filename =’a.txt’)

打印出来的文档树就是inspect中的控件树完全展开的样子,都是有层级的,和微信程序中的各个元素是一一对应的:

3 常用查找方法

# 拿到微信主窗口
win_main_Dialog = app.window(class_name='WeChatMainWndForPC')
# 主窗口下的某个窗口,不管层级的找
chat_list = win_main_Dialog.child_window(control_type='List', title='会话')
first = chat_list.items()[0] # 第一个聊天项  列表支持items(),支持循环,支持索引

# 详情页修改备注操作  parent()和children()都是只往上或往下查找一个层级,所有满足的放进列表
details_page = win_main_Dialog.child_window(class_name='ContactProfileWnd') # 窗口下的某个窗口
we_id = details_page.child_window(title="微信号:", control_type="Text").parent().children()[1].window_text() # 窗口的爸爸的第二个儿子的文字
alia = details_page.child_window(title="微信号:", control_type="Text").parent().parent().children()[0].children()[0].window_text()
edit_btn = details_page.child_window(title="备   注", control_type="Text").parent().children()[1]
edit_btn.click_input()
btn_modify_name_edit = edit_btn
# 先ctrl+a选中所有然后再type_keys替换
btn_modify_name_edit.type_keys('^a').type_keys('备注名字', with_spaces=True)

# descendants查找所有后代中满足的,不管层级,所有满足的放进列表
btns_list = win_main_Dialog.child_window(control_type='ToolBar').parent().descendants(control_type='Button')
btns_list[0].click_input()

dialog.child_window(title="文件名(N):", auto_id="1148", control_type="Edit")

4 快速定位

定位一个元素我们可以一层一层定位,但是这样真就有点笨蛋了,不仅效率低下还不容易适应结构变化,可以先定位某个页面,打印出页面结构,然后基于页面快速定位

 

 

 

    def we_name(self):
        # todo+++++++++++++++++++++++++++++++++++++
        try:
            self._popup = wechat.win_main.child_window(class_name='ContactProfileWnd')
            self._popup.wait('visible')
            self._popup.print_control_identifiers(depth=None, filename=None)

            print(self._popup.Edit.window_text()) # www.pu🤗
            print(self._popup.Edit0.window_text()) # www.pu🤗
            print(self._popup.Edit1.window_text()) # www.pu🤗

            print(self._popup.Edit2.window_text()) # qwer1315458571
            print(self._popup.child_window(best_match='微信号:Edit').window_text()) # qwer1315458571
            print(self._popup.child_window(best_match='Edit2').window_text()) # qwer1315458571

            return self._popup.Edit.window_text()
            # return self._popup.child_window(title="微信号:", control_type="Text").parent().parent().children()[0].children()[0].window_text()
        except:
            return None
快速定位 伪代码

四、控件自带的的方法

1. 点击和输入

# 左点击,可以点进源码,还有double_click_input,right_click_input等
edit_btn.click_input()

# 先ctrl+a选中所有然后再type_keys替换,和我们选中然后修改一样的
edit_btn.type_keys('^a').type_keys('备注名字', with_spaces=True)
SHIFT                            +      
CTRL                             ^      
ALT                               %
空格键                            {SPACE}

BACKSPACE                        {BACKSPACE}、{BS}   or   {BKSP}      
BREAK                            {BREAK}      
CAPS   LOCK                      {CAPSLOCK}      
DEL   or   DELETE                {DELETE}   or   {DEL}      
DOWN   ARROW                     {DOWN}      
END                              {END}      
ENTER                            {ENTER}   or   ~      
ESC                              {ESC}      
HELP                             {HELP}      
HOME                             {HOME}      
INS   or   INSERT                {INSERT}   or   {INS}      
LEFT   ARROW                     {LEFT}      
NUM   LOCK                       {NUMLOCK}      
PAGE   DOWN                      {PGDN}      
PAGE   UP                        {PGUP}      
PRINT   SCREEN                   {PRTSC}      
RIGHT   ARROW                    {RIGHT}      
SCROLL   LOCK                    {SCROLLLOCK}      
TAB                              {TAB}      
UP   ARROW                       {UP}     
+                                {ADD}      
-                                {SUBTRACT}      
*                                {MULTIPLY}      
/                                {DIVIDE}
常用快捷键

常规使用很方便,但是有些字符,比如微信中的用户昵称什么的带有表情等特殊符号,用自带的输入方法就会不适用,可以使用keyboard模块(见下)

2.对控件截图并保存

ctrl_qrcode = self.win_login.child_window(title='二维码', control_type='Image')
if ctrl_qrcode.exists(): 
    ctrl_qrcode.capture_as_image().save(img_path)

capture_as_image() 方法 返回控件的其实是 PIL image对象,所以可用该方法的属性方法,比如save

3.窗口的等待

窗口加载需要时间,我们又不能一直sleep就需要等待,等待窗口出现或者等待窗口关闭:

save_dialog.wait('ready',timeout=2)
save_dialog.close()
save_dialog.wait_not('visible')

# 'exists':窗口是有效的句柄
# 'visible':窗口未隐藏,常用
# 'enabled':未禁用窗口
# 'ready':窗口可见并启用,常用
# 'active':窗口处于活动状态

4.窗口存在和关闭

self.chatwnd = wechat.app.window(class_name='ChatWnd')
if self.chatwnd.exists():
    self.chatwnd.close()

5.其他

# 顶层窗口
dlg = app.top_window()
# 点方法取值
print(dlg.class_name()) #'WeChatMainWndForPC'
# 滚动 常用于页面的滚动,比如好友列表、聊天列表、消息界面
chat_list.scroll(direction='up', amount='page')

五、鼠标操作

pywinauto自带的鼠标操作有些时候并不能完全满足要求,可以调用mouse的方法

导入:

from pywinauto import mouse

常见操作:

# 移动鼠标
mouse.move(coords=(x, y))

# 指定位置,鼠标左击
mouse.click(button='left', coords=(40, 40))

# 鼠标双击
mouse.double_click(button='left', coords=(140, 40))

# 将属性移动到(140,40)坐标处按下
mouse.press(button='left', coords=(140, 40))

# 将鼠标移动到(300,40)坐标处释放,
mouse.release(button='left', coords=(300, 40))

# 右键单击指定坐标
mouse.right_click(coords=(400, 400))

# 鼠标中键单击指定坐标(很少用的到)
mouse.wheel_click(coords=(400, 400))

# 滚动鼠标 wheel_dist指定鼠标滚轮滑动,正数往上,负数往下。
mouse.scroll(coords=(1200,300),wheel_dist=-3)

示例:

# 以控件中心为起点,滚动
def mouse_scroll(control, distance):
    rect = control.rectangle()
    cx = int((rect.left+rect.right)/2)
    cy = int((rect.top + rect.bottom)/2)
    mouse.scroll(coords=(cx, cy), wheel_dist=distance)
mouse_scroll(control=win_main_Dialog.child_window(control_type='List', title='联系人'), distance=-5)

六、键盘操作

和控件自己的type_keys方法效果一样,但是更快,那个是从前到后啪啪啪的输入,这个是一下就出来了那种

在发送文件和图片的时候可以使用键盘模块,复制粘贴,比啪啪啪输入路径再发送速度快多了

并且该模块可以适配很多表情等特殊符号

import keyboard
import io

for line in io.StringIO(msg):
    keyboard.write(line.strip()) #
    keyboard.send('ctrl+enter')   
keyboard.write(chat_name)
keyboard.send('enter')
keyboard.send('ctrl+v')

 

纯干货,可以说是全网最详细最全面讲解,如果确实帮助到了你,右侧打赏一分或者点个推荐吧~

 

posted @ 2020-10-28 18:35  www.pu  Views(37537)  Comments(36Edit  收藏  举报