PYTHON第九十七天笔记1.11-星期四
自记录:
find_element_….:是找第一个;
find_elements_…..:是找所有的。
selenium剩余知识+爬虫破解滑动验证
selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器
from selenium import webdriver browser=webdriver.Chrome() browser=webdriver.PhantomJS()
1、#安装:selenium+chromedriver:
pip3 install selenium 下载chromdriver.exe放到python安装路径的scripts目录中即可,最新版本是2.35(注意:chromedriver的最新版本一定要和chrome浏览器的最新一致;否则报错: error: missing or invalid 'entry.level' ) 国内镜像网站地址:http://npm.taobao.org/mirrors/chromedriver/2.29/ 最新的版本去官网找(FQ):https://sites.google.com/a/chromium.org/chromedriver/downloads
>>> from selenium import webdriver >>> driver=webdriver.Chrome() #弹出浏览器 >>> driver.get('https://www.baidu.com') >>> driver.page_source
>>> driver.close()
2、#安装:selenium+phantomjs
pip3 install selenium
#下载phantomjs,解压后把phantomjs.exe所在的bin目录放到环境变量
(据亲测,此种会报错selenium.common.exceptions.WebDriverException: Message: 'phantomjs' executable needs to be in PATH. )
解决:
(1)、可以采用给加参数的方式:
driver=webdriver.PhantomJS(executable_path=r"C:\Users\WM\phantomjs-2.1.1-windows\bin\phantomjs")
(2)、解压后直接把phantomjs.exe放到python安装目录下就行(防止加环境变量报错的问题):
下载链接:http://phantomjs.org/download.html
>>> from selenium import webdriver >>> driver=webdriver.PhantomJS() #无界面浏览器 >>> driver.get('https://www.baidu.com') >>> driver.page_source
>>> driver.close()
图片下载: