【python+selenium的web自动化】- 针对上传操作的实现方案

如果想从头学起selenium,可以去看看这个系列的文章哦!

https://www.cnblogs.com/miki-peng/category/1942527.html

关于上传操作

​ 上传有两种情况:

  • 🔶 如果是input可以直接输入路径的,那么直接使用send_keys(文件路径)输入路径即可;
  • 🔶 非input标签的上传,则需要借助第三方工具:第三方库 pywin32、第三方工具pyautogui等等。

​ 那这里针对以上两种情况分别介绍一下具体的解决方法。

input标签

​ 定位到元素,然后直接使用send_keys(文件路径)输入路径,比较简单。

from selenium import webdriver

driver = webdriver.Chrome()

driver.get("http://xxxx")
driver.maximize_window()

# 定位上传文件元素
input_file = driver.find_element_by_id("xxx")

# 上传文件
input_file.send_keys(r"D:\learn\xx.txt")

第三方库 pywin32

​ 非input标签的上传,则需要借助第三方工具。pywin32就是这样的一个第三方库,主要是方便python开发者快速调用windows API的一个模块库,可以识别上传对话框句柄进而操作。安装命令:pip install pywin32

​ 从上面的上传窗口,及WinSpy工具窗口,可以得出控制关系图如下:

​ 从上图可以看出:

  • 文件名输入框的路径为:上传窗口 - > comboBoxEx32 - >comboBox - > Edit,在第四级edit;
  • 按钮的路径为:上传窗口 - > button(打开按钮),在第二级。

​ 我们需要一步一步定位,从第一层开始往下去找,找到对应的窗口然后进行操作,步骤说明如下🔻:

​ 1️⃣ 第一步:先定位到第一层大窗口(即整个上传窗口),使用win32gui模块下的FindWindow(),它是专门用于查找大窗口的;

​ 2️⃣ 第二步:在大窗口下查找子窗口,使用win32gui模块下的FindWindowEx(),查找大窗口以下的子窗口都是用这个方法;

​ 3️⃣ 第三步:定位到最后要操作的窗口后,就开始要执行编辑、点击这个操作了,不管是编辑还是点击都是使用win32gui模块下的SendMessage()

​ 以上三步的相关函数说明如下🔻:

  • win32gui.FindWindow(IpClassName,IpWindowName):自顶层窗口开始寻找匹配条件的窗口,并返回这个窗口的句柄
    • IpClassName:类名,在Spy++里能够看到
    • IpWindowName:窗口名,标题栏上能看到的名字
  • win32gui.FindWindowEx(hwndParent=0,hwndChildAfter=O,IpClassName=None,IpWindowName=None):搜索类名和窗体名匹配的窗体,并返回这个窗体的句柄,找不到就返回0
    • hwndParent:若不为0,则搜索句柄为hwndParent窗体的子窗体
    • hwndChildAfter:若不为0,则按照z-index的顺序从hwndChildAfter向后开始搜索子窗体,否则从第一个子窗体开始搜索
    • IpClassName:字符型,是窗体的类名,这个可以在Spy++里能够看到
    • IpWindowName:字符型,是窗口名,就是标题栏上能看到的名字
  • win32gui.SendMessage(hWnd, Msg, wParam, IParam)
    • hWnd:整型,接收消息的窗体句柄
    • Msg:整型,要发送的消息,这些消息都是windows预先定义好的
    • wParam:整型,消息的wParam参数
    • IParam:整型,消息的IParam参数

​ 以下是封装好的上传函数,因为window的上传窗口是固定不变的,我们只需要封装好一个类知道如何去调用即可,不需要理解它的处理细节,但如果你有兴趣可以深入了解一下。

import win32gui
import win32con

# edit - combobox - comboBoxEx32 - #32770  编辑框在第四级
# button - #32770  打开按钮在第二级

# 前提:window上传窗口已经出现,最好sleep 1-2秒等待窗口出现

def upload(filepath, browser_type="chrome"):
    if browser_type == "chrome":
        title = "打开"
    else:
        title = ""

    # 找元素
    # 从一级开始找,一级窗口“#32770”,“打开”
    dialog = win32gui.FindWindow("#32770", title)  # FindWindow用于找大窗口

    # 二级之后都用FindWindowEx,需要四个参数,
    # 1、元素的父亲,2、从第一个子代开始找元素,3、元素的类型名(class),4、元素的文本值
    comboBoxEx32 = win32gui.FindWindowEx(dialog, 0, "ComboBoxEx32", None)  # 二级
    comBox = win32gui.FindWindowEx(comboBoxEx32, 0, "ComboBox", None)  # 三级
    # 编辑框
    edit = win32gui.FindWindowEx(comBox, 0, 'Edit', None)  # 四级
    # 打开按钮
    button = win32gui.FindWindowEx(dialog, 0, 'Button', '打开(&0)')  # 二级

    # 往编辑框输入文件路径
    win32gui.SendMessage(edit, win32con.WM_SETTEXT, None, filepath)  # 发送文件路径
    win32gui.SendMessage(dialog, win32con.WM_COMMAND, 1, button)  # 点击打开按钮


if __name__ == '__main__':
    upload('D:\\test.txt')

第三方工具pyautogui

​ 还有一种更方便的方法,就是借助第三方工具pyautoguipyautogui是一个纯Python的GUI自动化工具,其目的是可以用程序自动控制鼠标和键盘操作,并且支持多平台(Windows,OS X,Linux)。强烈推荐!

​ 下面以举例的html为例,需要先把该代码保存成html文件,后续直接访问这个本地html文件:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
<h1> hello world </h1>
<input type="file" name="mfile">
</body>
</html>

​ 安装模块: pip install pyautogui,操作只需要两步:

  • 🍓 第一步:将要上传的文件路径写入到文件名的输入框内;
  • 🍓 第二步:敲回车,相当于点击【打开】按钮,注意回车presses要2次才能生效。
import os
import time
import pyautogui as ui
from selenium import webdriver

driver = webdriver.Chrome()
driver.implicitly_wait(20)      # 隐式等待
dir = os.getcwd()
html_dir = os.path.join(dir, 'demo.html')
driver.get(html_dir)

file_elem = driver.find_element_by_name('mfile')
file_elem.click()

# 系统之间要等待
time.sleep(1)

file_dir = os.path.join(dir, 'test.txt')	# 要上传的文件路径
# 写入文件
ui.write(file_dir)	# 直接调用写入
time.sleep(0.5)
# 输入回车键, presses表示按的次数,按一次不会生效,有可能是执行太快,建议presses=2
ui.press('enter', presses=2)
time.sleep(2)

driver.quit()

​ 不管是使用哪种上传方式,只要是操作系统的上传窗口,操作之前记得先等待一下。

posted @ 2021-03-15 10:32  miki_peng  阅读(2228)  评论(4编辑  收藏  举报