phantomjs
phantomjs简介--python
PhantomJS是一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,
JSON,Canvas 以及SVG。
phantomjs常用配置:
1 #从USER_AGENTS列表中随机选一个浏览器头,伪装浏览器 2 dcap["phantomjs.page.settings.userAgent"] = (random.choice(USER_AGENTS))
不载入图片,爬页面速度会快很多:
1 dcap["phantomjs.page.settings.loadImages"] = False
设置代理:
1 service_args = ['--proxy=127.0.0.1:9999','--proxy-type=socks5']
打开带配置信息的phantomJS浏览器:
1 driver = webdriver.PhantomJS(phantomjs_driver_path, desired_capabilities=dcap,service_args=service_args)
清澈的爱,只为中国