7.3日内容:
一、selenium剩余部分
二、BeautifulSoup4
一、selenium剩余部分
-元素交互操作
1.点击、清除
2.Actions Chains
是一个动作链对象,需要把driver驱动传给它
动作链接对象可以操作一系列设定好的动作行为
3.frame切换
4.执行js代码
execute_script()
数据格式:
json数据:
{
"name":"zxr"
}
XML数据:
<name>zxr</name>
HTML:
<html></html>
生成器:
yeild值(把值放进生成器中)
def f():
# return 1
yield 1
yield 2
yield 3
g = f()
print(g)
for line in g:
print(line)
二、BeautifulSoup4
BS4
1.什么是BeautifulSoup4?
BS4十一个解析库,可以通过某种解析器,
帮我们提取想要的数据
2.为什么要使用BeautifulSoup4?
因为它可以通过简洁的语法快速提取用户想要的数据内容
3.解析器的分类:
*****lxml HTML解析器
*****python标准库
lxml XML解析器
html5lib
4.安装与使用
-遍历文档树
-搜索文档树