selenium的基础学习

  一、概念:

  selenium是一个自动化测试框架,主要用到webdriver。

  二、webdriver(支持各大主流浏览器),chromedriver安装:

  下载chromedriver压缩包,下载地址:ChromeDriver官方网站或ChromeDriver仓库

  注:国内不能直接访问Chrome官网,可以在ChromeDriver仓库中下载(ChromeDriver与Chrome版本要对应)

  window下建议将程序放到谷歌浏览器安装目录下(例如:C:\Program Files (x86)\Google\Chrome\Application,并将这个目录添加到环境变量中)

  linux系统下添加环境变量(chromedriver假设在/home/user/下):

  export PATH="$PATH:/home/user"

  如果不设置环境变量,则需要在启动的时候指定路径

  from selenium import webdriver

  from selenium.webdriver import ChromeOptions

  #实例化chromedriver

  def get_chromedriver():

  #设置参数

  chrome_options = ChromeOptions()

  chrome_options.add_argument('--headless')#控制是否显示浏览器,注释将显示

  #chrome_options.add_argument("--start-maximized")#控制浏览器运行时的窗口大小

  chrome_options.add_argument('--disable-gpu')

  driverpath = "D:\chromedriver.exe"#下载的chromedriver.exe的全路径

  #创建谷歌浏览器驱动对象,用于后续操作浏览器

  chromedriver = webdriver.Chrome(executable_path=driverpath, options=chrome_options)

  return chromedriver

  三、启动浏览器

  from selenium import webdriver

  driver = webdriver.Chrome()

  # 指定路径启动

  driver = webdriver.Chrome(executable_path ='D:/chromedriver.exe')

  # from selenium.webdriver.chrome.options import Options

  from selenium.webdriver import ChromeOptions

  # option = Options()

  option = ChromeOptions()

  option.add_argument('--headless') #控制是否显示浏览器,注释将显示

  # 将插件xpath应用扩展加到浏览器中

  extension_path = 'D:/VM/2.0.2_0.crx'

  option.add_extension(extension_path)

  # 禁用浏览器正在被自动化程序控制的提示

  option.add_argument('--disable-infobars')

  driver = webdriver.Chrome(options=option)

  # driver = webdriver.PhantomJS() # 无界面浏览已停止更新,建议使用headless

  四、控制浏览器

  # 范文某个页面

  driver.get('https://www.baidu.com')

  # 刷新

  driver.refresh()

  # 后退

  driver.back()

  # 前进

  driver.forward()

  # 退出

  driver.quit()

  # 当前url地址

  driver.current_url

  # 截图

  driver.save_screenshot('./save.png')

  # 窗口最大化

  driver.maximize_window()

  五、元素查找

  # 根据css选择器查找

  driver.find_element_by_css_selector()

  # 根据元素id查找

  driver.find_element_by_id()

  # 利用xpath表达式查找

  driver.find_element_by_xpath()

  # 根据name属性查找

  driver.find_element_by_name()

  # 根据class属性查找

  driver.find_element_by_class_name()

  # 根据tag标签名字查找

  driver.find_element_by_tag_name()

  # 根据链接文本查找,全词匹配

  driver.find_element_by_link_text()

  # 根据链接文本查找,部分词匹配即可

  driver.find_element_by_partial_link_text()

  以上函数返回结果为单个WebElement对象,并且还有复数elements,例如:

  driver.find_elements_by_xpath()

  返回结果为列表,包含若干个WebElement对象,如果找不到则抛出异常

  六、等待wait相关

  # 隐式等待,如果没有立即查到某个元素,则等待10秒

  driver.implicitly_wait(10)

  # 显示等待(常使用)

  from selenium.webdriver.support.ui import WebDriverWait

  from selenium.webdriver.support import expected_conditions as EC

  from selenium.webdriver.common.by import By

  # 查找一个按钮,最长等待10秒,直到找到查找条件中指定的元素

  find_btn= WebDriverWait(driver,10).until(EC.presence_of_element_located((By.XPATH,'//div/a[2]')))

  七、WebElement

  和上面五条类似也有很多find函数

  其它函数:

  click:点击某个元素

  send_keys:

  # 向input框输入内容

  input.send_keys('内容')

  # 发送一个回车键

  from selenium.webdriver.common.keys import Keys

  input.send_keys(Keys.RETURN)

  rect:返回元素的宽和高,以及在屏幕上的坐标

  >>> driver.find_element_by_id('su').rect

  {'height': 44, 'width': 108, 'x': 844, 'y': 219}

  location:返回在屏幕上的坐标

  >>> driver.find_element_by_id('su').location

  {'x': 844, 'y': 219}

  text:返回查找元素内的文本信息,注意:用xpath表达式不可直接查找文本,只能用节点,再用text取文本

  >>> driver.find_element_by_xpath('//div[@id="s-top-left"]/a[1]').text

  '新闻' 郑州祛胎记医院哪家好 http://m.zykdtj.com/

  get_attribute和get_property:获取元素属性值,要先写到节点,再用此方法

  >>> driver.find_element_by_xpath('//div[@id="s-top-left"]/a[1]').get_property('href')

  'http://news.baidu.com/'

  >>> driver.find_element_by_xpath('//div[@id="s-top-left"]/a[1]').get_attribute('href')

  'http://news.baidu.com/'

  value_of_css_property:获取节点的CSS样式属性,直接写css样式属性

  >>> driver.find_element_by_xpath('//div[@id="s-top-left"]/a[1]').value_of_css_property('color')

  'rgba(34, 34, 34, 1)'

  >>> driver.find_element_by_xpath('//div[@id="s-top-left"]/a[1]').value_of_css_property('display')

  'inline-block'

  page_source:获取页面源码

  get_cookie/get_cookies:获取服务器返回的cookie

  # 获取cookie可以通过内置的函数get_cookies(),所有get_cookies()返回值是由字典组成的列表。

  >>> driver.get_cookies()

  [{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '32288_1462_32439_32379_32355_32045_32393_32429_32115_32430'},

  {'domain': '.baidu.com', 'expiry': 16270826.868372, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': '511D707AFD063BF502B538461401:FG=1'},

  {'domain': '.baidu.com', 'expiry': 3743908473.868326, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': '511D707AFD063BF57F7240F1FC3E5'}, {'domain': '.baidu.com', 'expiry': 37438473.868351, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '15964688'},

  {'domain': 'www.baidu.com', 'expiry': 15288828, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '123353'},

  {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '1'}]

  # 设置新的cookie

  >>> driver.add_cookie({'name':'lianxi','value':'lili'})

  >>> driver.get_cookies()

  结果其中包含:

  {'domain': 'www.baidu.com', 'expiry': 22272361, 'httpOnly': False,

  'name': 'lianxi', 'path': '/', 'secure': True, 'value': 'lili'}

  八、执行JS

  # 滚动条到底

  driver.execute_script('window.scrollTo(0,document.body.scrollHeight)')

  # 滚动到某个元素可见

  next_page = driver.find_element_by_css_selector('a.pn-next')

  driver.execute_script("return arguments[0].scrollIntoView();", next_page)

  # 执行异步js函数

  driver.execute_async_script('send_xml_request()')

posted @ 2020-08-05 16:17  tiana_Z  阅读(169)  评论(0编辑  收藏  举报