会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
nerocloud
博客园
首页
新随笔
联系
订阅
管理
2018年5月23日
.net core + headless chrome实现动态网页爬虫
摘要: 一般的http请求库只能够抓取到网页的静态内容,如果想抓取通过js动态生成的内容可以使用没有gui的browser库,之前许多人会使用phantomjs作为headless browser,不过现在phantomjs团队已经宣布停止更新工作,需要一款替代库,于是这里就采用了headless chro
阅读全文
posted @ 2018-05-23 17:50 nerocloud
阅读(2138)
评论(1)
推荐(1)
编辑
公告