从10月底至今,很多站长遇到了站点收录变慢、收录量变少甚至是完全不收录的问题。百度站长平台官方反馈,得到的回复几乎都是一样的结果,让人感到十分“无力“。
大家应该对百度官方这条回复已经烂熟于心了:
“您好,反馈页面已被抓取成功,预计需要一周的时间收录,请耐心等待,感谢您对百度的关注和支持!”
对于收录这件事情,站长之家也一直很关注,同时也有不少站长希望我们能聊一聊百度不收录的话题。
坦白的说,关于目前百度收录问题,站长之家在咨询官方人员后,也没有得到明确的回复,并不能给予站长朋友们实践性的解决方案。不过我们还是对目前的收录问题,做了一些简单的数据分析和观察,借此跟大家一起分享。
本次站长之家整理的数据来源需要强调和明确的是:
-
网站收录量数据(最近60天)是基于百度site命令查询得到,获取的收录数据与真实数据存在一定的误差(百度官方提示只做参考)。
-
使用site命令同时添加了inurl命令过滤了部分数据,尽可能保障获取的收录数据值是查询日期当日产生的新页面,而不是旧页面的快照页面数据。
-
查询的相关站点数据主要针对原先收录表现比较好的子域名或者目录,并不一定是整站收录数据。
-
由于是使用site命令查询站点的历史数据,因此查询到的站点对应日期收录数据,并非页面产生日期的当天收录数据。
-
查询站点并没有涵盖门户站点、纸媒报媒旗下站点,主要是考虑此类大站点和百度往往有深度合作,加上权威性更强、数据量更新大,更不容易受到影响,即使受百度调整影响,也能及时恢复,因此没有纳入。
我们基于以上数据查询的方法和查询时间,获取了站点收录数据,仅供趋势分析参考、管中窥豹,并不能代表相关站点的百度实际收录情况。
下文以站长之家的子站点运营领域为例,我们筛选了一些知名的科技资讯媒体、素材资源类站点做数据观察。
一、科技资讯类站点收录观察
根据所选的一些知名科技媒体(cnbeta、IT之家、Donews、Techweb、快科技、36氪、威锋网、鞭牛士等)数据可以看出,这些站点的历史收录量波动幅度都比较大。
如上图所示,多数站点的最近15天的历史收录量并没有特别多,相对站点的日更新量来说,都整体偏低。
当然,也有些媒体站点收录量并没收太大的影响,虽然有所下降,但整体来说影响不大。以cnBeta为例(下图),最近30天日均历史收录量基本稳定在150到200之间。(注:周末更新量较低,其收录量相应减少,但也稳定在60到100之间)。
我们继续观察这些站点最近60天日均历史的收录情况,明显看出大部分的站点收录情况有一些共同的特征:
1、从10月25日到11月22日期间,多家站点的当日历史收录量降到一个很低的水平,每天仅收录几条。虽然存在百度SITE命令在查询旧数据可能不精准的情况,但是不可否认的是,多数站长明确感知到这期间收录存在明显的减少。
11月期间,站长之家子站点产生的新页面收录量也是大幅度减少。即使目前通过SITE命令查询历史结果也显示这期间产生的页面依然没有被收录。
2、从11月23日开始,大部分站点的日均历史收录量都明显增加,但仍未恢复到正常状态。这期间,许多站长感受最深的一点就是,收录量有限,收录时间比以往要慢,有明显滞后的情况存在,往往有1至2周的收录延迟。
3、从12月21日开始,一些科技资讯类站点的日均历史收录量明显的上涨,涨幅较大。
我们以驱动中国最近60天的日均历史收录情况为例,该站点从11月22日至12月17日期间,收录情况得到了改善,开始出现增长,从原先数十条收录量上升至30条左右。而到了12月23日,收录量70多条,涨了近一倍。
同样的,可以看到TechWeb、donews等站点收录量也是从12月21日开始攀升,23日则达到最近几天的峰值。其中Donews从原先的几十条上涨到300多条,TechWeb也是从十多条增长至近200条。
不过,也有一些站点的收录情况依旧没有改善,始终保持在较低的水平。
二、设计资源站点收录观察
我们也观察了多家设计素材资源类站点(千网、我图网、红动中国、昵图网、懒人图库等),同样发现大部分最近60天日均历史收录情况与科技资讯类站点有很大的相似性。
1、10月25日到11月22日期间,日均历史收录量都大幅度减少。
2、从12月21日开始,一些资源类站点的历史收录量明显的上涨,涨幅较大。涨幅情况从下图就可以看出来,这里就不再作仔细分析了。
三、观察总结
-
11月份期间的历史收录数据反馈出,很多中小网站的收录数据出现明显异常、减少或者不收录,原创度以及更新度比较高的站点也未能避免。
-
11月份至今,许多原本收录很好的网站,网站的收录时间也出现了明显的滞后情况,新产生的页面,往往需要1-2周才会被收录。
-
11月底开始,大部分站点的历史收录量开始增加,期间百度可能存在调整。
-
12月21号之后,许多站点的收录量开始暴涨,接近正常水平,很有可能是百度的新一轮调整改善了收录情况。
-
这里做个补充:收录异常期间,站长之家通过对部分网站的蜘蛛分析发现,百度蜘蛛对最新页面的爬取大幅度减少,但是历史页面爬取频率并没有出现明显的下降。
虽然此前百度就明确表示,将在年末严加打击快排站点、聚合页、垃圾内容,不过我们的观察并不能直接得出近期的收录异常与此有直接的相关性。
好消息是,从目前的收录查询数据来看,百度肯定也在积极的调整和改善。
2021年将至,随着新一波的改善,有人已经站在了山顶,有人还在山底徘徊,只能抱团取暖,2020年末的冬天,我们不曾“孤独”!