夺命雷公狗—玩转SEO---63---页面相似度算法原理
度娘在2009年申请了一款专利技术,专利文档下载地址:https://files.cnblogs.com/files/leigood/%E7%BD%91%E9%A1%B5%E7%BB%93%E6%9E%84%E7%9B%B8%E4%BC%BC%E6%80%A7%E7%A1%AE%E5%AE%9A%E6%96%B9%E6%B3%95%E5%8F%8A%E8%A3%85%E7%BD%AE.zip
模板相似度,比如我们想仿造一个网站,标签内容什么都一样的,但是名字不同,产品不同,如下所示:
别人出售的是切割机,我们用来出售拖拉机,而且所有使用的标签都一样,就是名词不同,这种方式就称之为:“模板一致”,这样是不利于网站优化的~~!
如果想要仿不是不可以,不过需要做一些改动,不能全部一样,除非域名很厉害,否则不要这样玩了,因为搜索引擎会判断为抄袭别人的网站,虽然产品不同,但是属于天生盗用了别人的骨架,因为只是将别人网站的骨架来用,只是替换了一下产品而已,没有原创度在里面,对于新站而已,搜索引擎不太喜欢的~~!
度娘模板专利可以总结如下几点:
1、根据DOM树确定模板的特征问题,跟数据库中的模板进行比对。
2、每个标签的组合都可以当成一个单元,度娘他会有自己的库,来存放模板的特征,可以理解为我们网站的源码<div>test。。。。。</div>没块都是有特征在里面的:
3、多节点的特征单元决定模板的特征问题~ ~!
4、节点在列表特征中占据一点的比值,如果一大串代码,那么我们的关键词就需要布局进入li 标签中去,如下所示:
这里其实就是布局了长尾词进去而已,而且嵌入关键词达到60%(如10个li其中6个都做了关键词布局)左右基本都可以了,不用全部都加~~!
5、特征单元的深度越深,权重越低
6.重复得兄弟节点权重递减,且影响节点下的单元
<div> <div><ol><li>拖拉机哪里好</li></ol></div> <div><ol><li>拖拉机哪里贵</li></ol></div> <div><ol><li>拖拉机维修费用<div><a>test</a></div></li></ol></div> </div>
也就是说拖拉机哪里好的这个 li 的权重是最最高的,下面div的会层层递减~~!
7、无用标签尽量少用,而且还有可能降低网站权重
8、网站模板多样化,比如每个栏目下的模板都是不同的
内容相似度和模板相似度都是各占50%左右的评分的,但是还是建议自己开发一套模板,或者大改,否则基本木有啥卵用,度娘还是挺强大的~~!