自动化

基本用法:https://www.cnblogs.com/themost/p/6900852.html

 

环境:Pycharm Chrome驱动(放在python目录下)  python      selenium插件安装(通过pip install -U selenium命令)

from selenium import webdriver
import time
driver = webdriver.Chrome()   #声明浏览器
driver.maximize_window()
driver.get('https://www.baidu.com/')  #打开浏览器预设地址
driver.get('https://www.taobao.com/')
driver.forward()
driver.back()
time.sleep(2)
driver.find_element_by_id('kw').send_keys('博客园')
driver.find_element_by_id('su').click()
time.sleep(2)

 实战:https://blog.csdn.net/liuuil4421640/article/details/79167989?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param

问题1:ElementClickInterceptedException

浏览器下拉框会覆盖元素

 

selenium定位元素:

wd.find_element_by_id('kw')

使用了 WebDriver 对象 的方法 find_element_by_id,这行代码运行是,就会发起一个请求通过 浏览器驱动 转发给浏览器,告诉它,需要选择一个id为 kw 的元素。浏览器,找到id为kw的元素后,将结果通过 浏览器驱动 返回给 自动化程序, 所以 find_element_by_id 方法会 返回一个 WebElement 类型的对象。

这个WebElement 对象可以看成是对应 页面元素 的遥控器。我们通过这个WebElement对象,就可以 操控 对应的界面元素。调用这个对象的 send_keys 方法就可以在对应的元素中 输入字符串,调用这个对象的 click 方法就可以 点击 该元素。

WebDriver对象作用于整个web页面;

find_elements_by_class_name 方法返回的是找到的符合条件的 所有 元素 (这里有3个元素), 放在一个 列表 中返回。而如果我们使用 find_element_by_class_name (注意少了一个s) 方法, 就只会返回 第一个 元素。

如果find_element找不到抛出异常,find_elements如果没有会返回空列表。text获取元素的文本

 

 <span> 标签被用来组合文档中的行内元素。

实例:使用 <span> 元素对文本中的一部分进行着色:   <p>我的母亲有 <span style="color:blue">蓝色</span> 的眼睛。</p>

 

当发现元素没有找到的时候, 并不 立即返回 找不到元素的错误。而是周期性(每隔半秒钟)重新寻找该元素,直到该元素找到,或者超出指定最大等待时长,这时才 抛出异常(如果是 find_elements 之类的方法, 则是返回空列表)。

Selenium 的 Webdriver 对象 有个方法叫 implicitly_wait该方法接受一个参数, 用来指定 最大等待时长

如果我们 加入如下代码 wd.implicitly_wait(10)那么后续所有的 find_element 或者 find_elements 之类的方法调用 都会采用上面的策略:如果找不到元素, 每隔 半秒钟 再去界面上查看一次, 直到找到该元素, 或者 过了10秒 最大时长。

好处:在最好情况下(网页立即响应)最多多等半秒钟,比sleep设置的时间短,提高效率

 

获取元素属性

通过WebElement对象的 get_attribute 方法来获取元素的属性值,比如要获取元素属性class的值,就可以使用 element.get_attribute('srcid')

如下:

element = wd.find_element_by_id('input_name')
print(element.get_attribute('class'))

执行完自动化代码,如果想关闭浏览器窗口可以调用WebDriver对象的 quit 方法,像这样 wd.quit()

获取整个元素对应的HTML(div内外)

要获取整个元素对应的HTML文本内容,可以使用 element.get_attribute('outerHTML')

如果,只是想获取某个元素 内部 的HTML文本内容,可以使用 element.get_attribute('innerHTML')

 

CSS3 选择器

在 CSS 中,选择器是一种模式,用于选择需要添加样式的元素。

"CSS" 列指示该属性是在哪个 CSS 版本中定义的。(CSS1、CSS2 还是 CSS3。)

选择器例子例子描述CSS
.class .intro 选择 class="intro" 的所有元素。 1
#id #firstname 选择 id="firstname" 的所有元素。 1
* * 选择所有元素。 2
element p 选择所有 <p> 元素。 1
element,element div,p 选择所有 <div> 元素和所有 <p> 元素。 1
element element div p 选择 <div> 元素内部的所有 <p> 元素。 1
element>element div>p 选择父元素为 <div> 元素的所有 <p> 元素。 2
element+element div+p 选择紧接在 <div> 元素之后的所有 <p> 元素。 2
[attribute] [target] 选择带有 target 属性所有元素。 2
[attribute=value] [target=_blank] 选择 target="_blank" 的所有元素。 2
[attribute~=value] [title~=flower] 选择 title 属性包含单词 "flower" 的所有元素。 2
[attribute|=value] [lang|=en] 选择 lang 属性值以 "en" 开头的所有元素。 2
:link a:link 选择所有未被访问的链接。 1
:visited a:visited 选择所有已被访问的链接。 1
:active a:active 选择活动链接。 1
:hover a:hover 选择鼠标指针位于其上的链接。 1
:focus input:focus 选择获得焦点的 input 元素。 2
posted @ 2020-07-24 10:50  acehm  阅读(182)  评论(0编辑  收藏  举报