会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
energy
博客园
首页
新随笔
联系
管理
订阅
2017年3月2日
网络爬虫爬取动态网页
摘要: 尽量不要模拟浏览器去爬取资源,效率低且耗资源, selenium可以用不同的驱动,比如firefox,chrome和你提到的PhantomJS,还支持(模拟?)safari、安卓的浏览器等。 举例:例如在百度中搜索成语词典,显示如下,需要爬取所有的成语词汇。我们可以点击下一页查看,有经验的同学一眼就
阅读全文
posted @ 2017-03-02 13:50 energy1989
阅读(223)
评论(0)
推荐(0)
编辑
公告