会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Levitt
博客园
首页
新随笔
联系
订阅
管理
2016年2月6日
Nodejs爬虫进阶=>异步并发控制
摘要: 之前写了个现在看来很不完美的小爬虫,很多地方没有处理好,比如说在知乎点开一个问题的时候,它的所有回答并不是全部加载好了的,当你拉到回答的尾部时,点击加载更多,回答才会再加载一部分,所以说如果直接发送一个问题的请求链接,取得的页面是不完整的。还有就是我们通过访问链接下载图片的时候,是一张一张来下的,如
阅读全文
posted @ 2016-02-06 12:21 Levitt
阅读(13689)
评论(5)
推荐(5)
编辑
公告