随笔分类 -  爬虫

爬虫学习
摘要:这一篇我们聊聊在页面抓取时应该注意到的几个问题。一:网页更新 我们知道,一般网页中的信息是不断翻新的,这也要求我们定期的去抓这些新信息,但是这个“定期”该怎么理解,也就是多长时间需要抓一次该页面,其实这个定期也就是页面缓存时间,在页面的缓存时间内我们再次抓取该网页是没有必要的,反而给人家服务器造成... 阅读全文
posted @ 2015-12-21 11:06 任飞儿 阅读(409) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示