今天查看网站访问记录的时候,意外发现我的网页竟然列在了补充材料里面。很奇怪,为什么这个网页会放在补充材料里面,上网研究了一下,发现网页被列为补充材料有以下几种可能:
- 重复内容
- 相同的title和description标签
- 内容部分过于稀少
- url部分变量太多
- 链接结构不理想,让搜索引擎很难发现
- 页面没有入链接
- 同一网站使用多个域名或者ip地址
我的网页是静态目录页,不存在重复内容的问题,链接结构很好,域名也没有问题,觉得可能是description tag里面的内容太过于重复了。因此,修改了一下模板,重新生成,看看什么时候能从补充材料里面出来。
通过上篇文章对Google SERP中补充结果(Supplemental Results)的介绍与分析,我想任何一个网站建设者都不希望自己辛辛苦苦创建的网页被纳入补充结果——一个不能为网站带来搜索引擎访问量的网页其价值将大大缩水,这样的网站优化无疑是失败的。——那么,如何避免这类惨剧的发生呢?
要搞清楚这个问题,让我们首先看看Google把什么样的网页放入“补充结果”。
网页为什么被纳入补充结果
当然,这又是一个牵涉到很多因素的问题,但从主要方面看,主要有如下原因:
复制内容(Duplicate Content)页面
这又分为几种情况,1、网站没有原创性的内容,内容拷贝自其他网站,如很多Clone DOMZ目录内容的网站最近被Google封杀或相应内容被放入补充结果。注意,这里的Duplicate Content不仅仅指内容完全一样,也包括页面中一定数量的文字相近或相似的情况。
2、链接地址的不规范,尤其对动态网页地址而言,这种情况极其普遍。如HighDiy论坛所使用的Dicuz程序,虽然号称国内最好的论坛程序,但对SEO而言实在要命,其网页地址中以“?”“&”所加的很多参数纯粹莫名其妙,导致同一个页面可以用无穷多个URL访问,这不可避免地被判定为Duplicate Content。
3、Canonical Issues,同样的Url不规范问题。所谓Canonical Issues,主要指网站的主访问路径,如果网站存在多种访问方式,搜索引擎会选择一种其认为最佳的方式确定为“权威地址”,比如说,对大多数网站而言,其主页可以用以下三种URL访问:
- www.pcstu.com
- pcstu.com/
- www.pcstu.com/index.html
但从技术上讲,这三个Url是不同的,可以分别显示单独的内容。对这种情况,Google会确定其认为最佳的一种为“权威地址”,比如说yourdomain.com,将其收录进主索引数据库,同时,Url以http://www.yourdomain.com/格式开头的网页(包括内部网页)则会被置入补充结果。
无内容或内容过少的网页
如果Google在页面内找不到足够的内容,那么,这类空页面被会被放入补充结果
成为“孤岛”的网页
如果出于某种原因,指向某个网页的链接丢失,这包括源自外部网站和源自网站内部的链接,Google的Spider在最近的一次抓取中找不到访问该页面的路径,那么,补充结果便成了其归宿。
网页被纳入补充结果后怎么办及如何预防
如果网站只是近期才发生页面被放入补充结果的情况,倒不必太过担心,这可能只是Google BigDaddy更新中的瑕疵,Google正在修正中,Matt Cutts在其Gone Supplemental的讨论中证实了这一点,
So the upshot is that if you’re one of these people who was paying attention to this issue, I think it has already improved quite a bit, and I would expect to see more pages indexed in the coming week or two. Some sites may see improvements earlier than others because of where a site happens to be in Google’s crawl cycle.
随着Google更新的进程,主索引数据库会逐步重建,相应的网页会回复正常。
而对于其他情况,则应仔细检查相应网站或网页,根据上面介绍的网页被纳入补充结果的原因,进行修正:
如果是因为Duplicate Content的缘故,那么,停止拷贝别人的网站,创作具有原创性的内容,使用301 redirect避免Canonical Issues,等等。
对于因被视作空页面而纳入补充结果的网页,确保网页中具有足够的内容。
对于孤岛网页,首先在网站内部建立链接指向它,条件允许的话,尽量为其建立来自外部权威网站或网页,anchor text中包含合适关键词的链接,当然,链接来源网页必须与该本页涉及主题相同或相近。
这并不是全部的工作,正如上文所言,一旦网页被纳入补充结果,Google的Spider便很少再去访问它,要使我们的修改被Google发现,还需要别的措施,如向google sitemap提供相应的地址,指引Spider的爬行。
但实事求是地说,这样的措施并不一定会起到作用,考虑到补充结果是网页坟墓的说法,如果我们的修改在一段时期内未被Google发现和接受,那么,最后的选择便只能是用新的Url重新发布那些内容了。