自动化
基本用法:https://www.cnblogs.com/themost/p/6900852.html
环境:Pycharm Chrome驱动(放在python目录下) python selenium插件安装(通过pip install -U selenium命令)
from selenium import webdriver import time driver = webdriver.Chrome() #声明浏览器 driver.maximize_window() driver.get('https://www.baidu.com/') #打开浏览器预设地址 driver.get('https://www.taobao.com/') driver.forward() driver.back() time.sleep(2) driver.find_element_by_id('kw').send_keys('博客园') driver.find_element_by_id('su').click() time.sleep(2)
问题1:ElementClickInterceptedException
浏览器下拉框会覆盖元素
selenium定位元素:
wd.find_element_by_id('kw')
使用了 WebDriver 对象 的方法 find_element_by_id,这行代码运行是,就会发起一个请求通过 浏览器驱动 转发给浏览器,告诉它,需要选择一个id为 kw 的元素。浏览器,找到id为kw的元素后,将结果通过 浏览器驱动 返回给 自动化程序, 所以 find_element_by_id 方法会 返回一个 WebElement 类型的对象。
这个WebElement 对象可以看成是对应 页面元素 的遥控器。我们通过这个WebElement对象,就可以 操控
对应的界面元素。调用这个对象的 send_keys 方法就可以在对应的元素中 输入字符串,调用这个对象的 click 方法就可以 点击 该元素。
WebDriver对象作用于整个web页面;
find_elements_by_class_name 方法返回的是找到的符合条件的 所有
元素 (这里有3个元素), 放在一个 列表
中返回。而如果我们使用 find_element_by_class_name (注意少了一个s) 方法, 就只会返回 第一个
元素。
如果find_element找不到抛出异常,find_elements如果没有会返回空列表。text获取元素的文本
<span> 标签被用来组合文档中的行内元素。
实例:使用 <span> 元素对文本中的一部分进行着色: <p>我的母亲有 <span style="color:blue">蓝色</span> 的眼睛。</p>
当发现元素没有找到的时候, 并不 立即返回 找不到元素的错误。而是周期性(每隔半秒钟)重新寻找该元素,直到该元素找到,或者超出指定最大等待时长,这时才 抛出异常(如果是 find_elements
之类的方法, 则是返回空列表)。
Selenium 的 Webdriver 对象 有个方法叫 implicitly_wait
该方法接受一个参数, 用来指定 最大等待时长。
如果我们 加入如下代码 wd.implicitly_wait(10)
那么后续所有的 find_element
或者 find_elements
之类的方法调用 都会采用上面的策略:如果找不到元素, 每隔 半秒钟 再去界面上查看一次, 直到找到该元素, 或者 过了10秒 最大时长。
好处:在最好情况下(网页立即响应)最多多等半秒钟,比sleep设置的时间短,提高效率
获取元素属性
通过WebElement对象的 get_attribute
方法来获取元素的属性值,比如要获取元素属性class的值,就可以使用 element.get_attribute('srcid')
如下:
element = wd.find_element_by_id('input_name')
print(element.get_attribute('class'))
执行完自动化代码,如果想关闭浏览器窗口可以调用WebDriver对象的 quit 方法,像这样 wd.quit()
获取整个元素对应的HTML(div内外)
要获取整个元素对应的HTML文本内容,可以使用 element.get_attribute('outerHTML')
如果,只是想获取某个元素 内部
的HTML文本内容,可以使用 element.get_attribute('innerHTML')
CSS3 选择器
在 CSS 中,选择器是一种模式,用于选择需要添加样式的元素。
"CSS" 列指示该属性是在哪个 CSS 版本中定义的。(CSS1、CSS2 还是 CSS3。)
选择器 | 例子 | 例子描述 | CSS |
---|---|---|---|
.class | .intro | 选择 class="intro" 的所有元素。 | 1 |
#id | #firstname | 选择 id="firstname" 的所有元素。 | 1 |
* | * | 选择所有元素。 | 2 |
element | p | 选择所有 <p> 元素。 | 1 |
element,element | div,p | 选择所有 <div> 元素和所有 <p> 元素。 | 1 |
element element | div p | 选择 <div> 元素内部的所有 <p> 元素。 | 1 |
element>element | div>p | 选择父元素为 <div> 元素的所有 <p> 元素。 | 2 |
element+element | div+p | 选择紧接在 <div> 元素之后的所有 <p> 元素。 | 2 |
[attribute] | [target] | 选择带有 target 属性所有元素。 | 2 |
[attribute=value] | [target=_blank] | 选择 target="_blank" 的所有元素。 | 2 |
[attribute~=value] | [title~=flower] | 选择 title 属性包含单词 "flower" 的所有元素。 | 2 |
[attribute|=value] | [lang|=en] | 选择 lang 属性值以 "en" 开头的所有元素。 | 2 |
:link | a:link | 选择所有未被访问的链接。 | 1 |
:visited | a:visited | 选择所有已被访问的链接。 | 1 |
:active | a:active | 选择活动链接。 | 1 |
:hover | a:hover | 选择鼠标指针位于其上的链接。 | 1 |
:focus | input:focus | 选择获得焦点的 input 元素。 | 2 |