网络爬虫的限制

网络爬虫的限制

1,来源审查:判断user-agent进行限制,只响应浏览器和友好爬虫

2,发布公告:robots协议(相当于告示牌),告知爬虫网站的爬取策略,要求爬虫遵守。什么能爬取,什么不能爬取。是否遵守,有爬虫自己决定。

posted on 2017-03-13 16:28  enet03  阅读(197)  评论(0)    收藏  举报