会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
天高任我飞
任飞儿
博客园
首页
新随笔
联系
管理
订阅
随笔- 176 文章- 2 评论- 13 阅读-
24万
随笔分类 -
爬虫
爬虫学习
爬虫基础学习 转【http://www.cnblogs.com/huangxincheng/archive/2012/11/08/2759752.html】
摘要:这一篇我们聊聊在页面抓取时应该注意到的几个问题。一:网页更新 我们知道,一般网页中的信息是不断翻新的,这也要求我们定期的去抓这些新信息,但是这个“定期”该怎么理解,也就是多长时间需要抓一次该页面,其实这个定期也就是页面缓存时间,在页面的缓存时间内我们再次抓取该网页是没有必要的,反而给人家服务器造成...
阅读全文
posted @
2015-12-21 11:06
任飞儿
阅读(409)
评论(0)
推荐(0)
编辑
公告
昵称:
任飞儿
园龄:
16年2个月
粉丝:
18
关注:
33
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
点击右上角即可分享