phantomjs

phantomjs简介--python

  PhantomJS是一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,

JSON,Canvas 以及SVG。

  phantomjs常用配置:

1 #从USER_AGENTS列表中随机选一个浏览器头,伪装浏览器
2 dcap["phantomjs.page.settings.userAgent"] = (random.choice(USER_AGENTS))

  不载入图片,爬页面速度会快很多:

1 dcap["phantomjs.page.settings.loadImages"] = False

  设置代理:

1 service_args = ['--proxy=127.0.0.1:9999','--proxy-type=socks5']

  打开带配置信息的phantomJS浏览器:

1 driver = webdriver.PhantomJS(phantomjs_driver_path, desired_capabilities=dcap,service_args=service_args)

 

posted @ 2018-04-16 16:53  巴蜀秀才  阅读(135)  评论(0编辑  收藏  举报