自动化

基本用法：https://www.cnblogs.com/themost/p/6900852.html

环境：Pycharm Chrome驱动（放在python目录下） python selenium插件安装（通过pip install -U selenium命令）

from selenium import webdriver
import time
driver = webdriver.Chrome()   #声明浏览器
driver.maximize_window()
driver.get('https://www.baidu.com/')  #打开浏览器预设地址
driver.get('https://www.taobao.com/')
driver.forward()
driver.back()
time.sleep(2)
driver.find_element_by_id('kw').send_keys('博客园')
driver.find_element_by_id('su').click()
time.sleep(2)

实战：https://blog.csdn.net/liuuil4421640/article/details/79167989?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param

问题1：ElementClickInterceptedException

浏览器下拉框会覆盖元素

selenium定位元素：

wd.find_element_by_id('kw')

使用了 WebDriver 对象的方法 find_element_by_id，这行代码运行是，就会发起一个请求通过浏览器驱动转发给浏览器，告诉它，需要选择一个id为 kw 的元素。浏览器，找到id为kw的元素后，将结果通过浏览器驱动返回给自动化程序，所以 find_element_by_id 方法会返回一个 WebElement 类型的对象。

这个WebElement 对象可以看成是对应 页面元素 的遥控器。我们通过这个WebElement对象，就可以 操控 对应的界面元素。调用这个对象的 send_keys 方法就可以在对应的元素中输入字符串，调用这个对象的 click 方法就可以点击该元素。

WebDriver对象作用于整个web页面;

find_elements_by_class_name 方法返回的是找到的符合条件的 所有 元素 (这里有3个元素)，放在一个 列表 中返回。而如果我们使用 find_element_by_class_name (注意少了一个s) 方法，就只会返回 第一个 元素。

如果find_element找不到抛出异常，find_elements如果没有会返回空列表。text获取元素的文本

标签被用来组合文档中的行内元素。

实例:使用 元素对文本中的一部分进行着色： 我的母亲有 蓝色 的眼睛。

当发现元素没有找到的时候，并不立即返回找不到元素的错误。而是周期性（每隔半秒钟）重新寻找该元素，直到该元素找到，或者超出指定最大等待时长，这时才抛出异常（如果是 find_elements 之类的方法，则是返回空列表）。

Selenium 的 Webdriver 对象有个方法叫 implicitly_wait该方法接受一个参数，用来指定 最大等待时长。

如果我们加入如下代码 wd.implicitly_wait(10)那么后续所有的 find_element 或者 find_elements 之类的方法调用都会采用上面的策略：如果找不到元素，每隔半秒钟再去界面上查看一次，直到找到该元素，或者过了10秒最大时长。

好处：在最好情况下（网页立即响应）最多多等半秒钟，比sleep设置的时间短，提高效率

获取元素属性

通过WebElement对象的 get_attribute 方法来获取元素的属性值，比如要获取元素属性class的值，就可以使用 element.get_attribute('srcid')

如下：

element = wd.find_element_by_id('input_name')
print(element.get_attribute('class'))

执行完自动化代码，如果想关闭浏览器窗口可以调用WebDriver对象的 quit 方法，像这样 wd.quit()

获取整个元素对应的HTML(div内外)

要获取整个元素对应的HTML文本内容，可以使用 element.get_attribute('outerHTML')

如果，只是想获取某个元素 内部 的HTML文本内容，可以使用 element.get_attribute('innerHTML')

CSS3 选择器

在 CSS 中，选择器是一种模式，用于选择需要添加样式的元素。

"CSS" 列指示该属性是在哪个 CSS 版本中定义的。（CSS1、CSS2 还是 CSS3。）

选择器	例子	例子描述	CSS
.class	.intro	选择 class="intro" 的所有元素。	1
#id	#firstname	选择 id="firstname" 的所有元素。	1
*	*	选择所有元素。	2
element	p	选择所有 <p> 元素。	1
element,element	div,p	选择所有 <div> 元素和所有 <p> 元素。	1
element element	div p	选择 <div> 元素内部的所有 <p> 元素。	1
element>element	div>p	选择父元素为 <div> 元素的所有 <p> 元素。	2
element+element	div+p	选择紧接在 <div> 元素之后的所有 <p> 元素。	2
[attribute]	[target]	选择带有 target 属性所有元素。	2
[attribute=value]	[target=_blank]	选择 target="_blank" 的所有元素。	2
[attribute~=value]	[title~=flower]	选择 title 属性包含单词 "flower" 的所有元素。	2
[attribute\|=value]	[lang\|=en]	选择 lang 属性值以 "en" 开头的所有元素。	2
:link	a:link	选择所有未被访问的链接。	1
:visited	a:visited	选择所有已被访问的链接。	1
:active	a:active	选择活动链接。	1
:hover	a:hover	选择鼠标指针位于其上的链接。	1
:focus	input:focus	选择获得焦点的 input 元素。	2

posted @ 2020-07-24 10:50 acehm 阅读(189) 评论(0) 收藏举报

刷新页面返回顶部

laurarararararara

自动化

selenium定位元素：

获取元素属性

获取整个元素对应的HTML(div内外)

CSS3 选择器

公告