PYTHON第九十七天笔记1.11-星期四

自记录:

find_element_….:是找第一个;

find_elements_…..:是找所有的。

 

selenium剩余知识+爬虫破解滑动验证

selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题
selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器
from selenium import webdriver browser=webdriver.Chrome() browser=webdriver.PhantomJS()

1、#安装:selenium+chromedriver:

pip3 install selenium
下载chromdriver.exe放到python安装路径的scripts目录中即可,最新版本是2.35(注意:chromedriver的最新版本一定要和chrome浏览器的最新一致;否则报错: error: missing or invalid 'entry.level' )
国内镜像网站地址:http://npm.taobao.org/mirrors/chromedriver/2.29/
最新的版本去官网找(FQ):https://sites.google.com/a/chromium.org/chromedriver/downloads

>>> from selenium import webdriver
>>> driver=webdriver.Chrome() #弹出浏览器
>>> driver.get('https://www.baidu.com')
>>> driver.page_source
>>> driver.close()

2、#安装:selenium+phantomjs
pip3 install selenium
#下载phantomjs,解压后把phantomjs.exe所在的bin目录放到环境变量
(据亲测,此种会报错selenium.common.exceptions.WebDriverException: Message: 'phantomjs' executable needs to be in PATH. )
解决:
(1)、可以采用给加参数的方式:

    driver=webdriver.PhantomJS(executable_path=r"C:\Users\WM\phantomjs-2.1.1-windows\bin\phantomjs")

 (2)、解压后直接把phantomjs.exe放到python安装目录下就行(防止加环境变量报错的问题):

  



下载链接:http://phantomjs.org/download.html
>>> from selenium import webdriver
>>> driver=webdriver.PhantomJS() #无界面浏览器
>>> driver.get('https://www.baidu.com')
>>> driver.page_source
>>> driver.close()









图片下载:

 

 









 
posted @ 2018-01-11 21:40  主啊~  阅读(79)  评论(0编辑  收藏  举报