蜘蛛的依旧疯狂与园子的新畅想:尝试放出被屏蔽的百度蜘蛛网段
因为看到博文 【故障公告】它(变异的百度蜘蛛)又来了,雪上加霜又加盐的三月,百度搜索部门的人昨天对园子进行了线上回访,让我们看到了一丝希望。
今天早上,带着这丝希望,我们试着放出今年3月因为过于疯狂、喜欢在别人地盘上飙车而被我们屏蔽的百度蜘蛛网段——116.179.37.0/24
,看看半年之后它是否“疯”子回头,结果依旧是意料之中的疯狂依旧,“疯”性难移。
放开后,园子博客站点的 web 服务器 cpu 立马飙升,“飙”字货真价实,不带一点夸张,放开后的 cpu 是屏蔽时的三倍左右。
放开后:
屏蔽时:
这次我们专门记录了放开阶段百度蜘蛛的请求量,取 9:00-9:04 的5分钟数据看一下,请求量是 277358
(27万),QPS(每秒请求数)是 924
(近一千)。
面对百度蜘蛛丝毫不减的疯狂,那一丝希望瞬间一扫而光,抛开小插曲带来的失望,燃起我们的新希望。
希望在没有百度的日子里,园子的发展更加阳光。
希望在没有百度的日子里,我们能够发挥开源力量。
在被百度离开一年多的日子里,我们产生了新的畅想——待园子发展壮大后,我们会发起一个公益基金会,发起一个开源搜索引擎项目,至少给开发者提供一个没有疯狂蜘蛛、基于公平透明规则的搜索引擎。