selenium
笔记
selenium 模块的基本使用
问题:selenium模块和爬虫之间具有怎样的关联
- 便捷的获取网站中动态加载的数据
- 便捷实现模拟登录
什么是selenium模块?
- 基于浏览器自动化的一个模块
selenium使用流程:
- 环境的安装 pip install selenium
- 下载一个浏览器的驱动程序
- 驱动程序和浏览器的驱动关系
- 实例化一个浏览器对象
- 编写基于浏览器自动化的操作代码
- 发起请求:get(url)
- 标签定位:find系列的方法
- 标签交互 send_keys('xxx')
- 执行js程序:execute_script('xxx')
- 前进,后退:back(),forward()
- 关闭浏览器: quit()
代码
from selenium import webdriver
from time import sleep
from selenium.webdriver.common.by import By
bro = webdriver.Chrome()
bro.get('https://www.taobao.com')
# 定位标签
#search_input = bro.find_element_by_id('q')
search_input = bro.find_element(By.ID, 'q')
# 标签交互
search_input.send_keys('美食')
#执行一组js程序
bro.execute_script('window.scrollTo(0, document.body.scrollHeight)')
sleep(3)
#点击搜索按钮
btn = bro.find_element(By.CSS_SELECTOR, '.btn-search')
btn.click()
bro.get('https://www.baidu.com')
sleep(2)
#回退
bro.back()
sleep(2)
#前进
bro.forward()
sleep(5)
bro.quit()