会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
再见紫罗兰
博客园
首页
新随笔
联系
订阅
管理
2019年1月4日
Selenium及Headless Chrome抓取动态HTML页面
摘要: 一般的的静态HTML页面可以使用requests等库直接抓取,但还有一部分比较复杂的动态页面,这些页面的DOM是动态生成的,有些还需要用户与其点击互动,这些页面只能使用真实的浏览器引擎动态解析,Selenium和Chrome Headless可以很好的达到这种目的。 Headless Chrome
阅读全文
posted @ 2019-01-04 17:16 再见紫罗兰
阅读(12715)
评论(1)
推荐(2)
编辑
公告