mephisto’blog

二人行,也有吾师!
Fork me on GitHub

我是怎么处理其他网站恶意爬虫博客园的,希望大家喜欢

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

阅读目录

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

 

介绍

  今天才写了个随笔,然后不到一个小时就有个网站进行了爬虫,呵呵好速度,而已百度的搜索排名比博客园还高,不过我加了防伪处理,大家看看效果吧。

现象

 百度搜索情况:

  看到没别人的网站排名还在前面。

    博客园的:

  

  然后再看看爬虫网站的:

 

  看到框出来的地方没,是不是很有意思,让别人一眼就知道是从哪来的,还能给博客园做广告,博客园得谢谢我们这些攻城狮。求感谢!!

版权处理

  我们怎么来加入版权处理捏。有很多方法。因为爬虫不可能把你这个网站的css和js全部给你爬过来,那整个网站就很臃肿了,还可能出问题,所以这里就有两种处理方法。

一种是js处理,另一种就是css处理。我觉得css处理比较简便,也不影响速度,就采取了css的处理。

  首先我们可以在 管理->选项->博客设置->页面定制CSS代码,如下:

在css中加入此段(红色方块)

  然后我们就可以愉快的在随笔中使用这个div的class了。

  我们在随笔中,随便那些地方,肆意妄为的加入这个就行了,然后其他爬虫网站就只能给我们做广告了,是不是小激动一下。当然这个处理比较简单,也比较容易编辑,大家有什么其他的好的想法也可以交流交流,毕竟知识也是有产权的,毕竟是一个字一个字码出来的,希望那些骗流量的网站积点功德。

 

今天又在网上搜了下,发现有4,5个网站在爬,其中有一个过滤做的很好,居然把那个div的内容过滤了,还是给大家看下吧。

--------------------------

-----------------------------

------------------------

  最后一个明显爬网很成功啊,希望博友们发挥下智慧,一起交流交流。

 

 

 

 

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

posted @ 2014-12-05 09:47  sinodzh  阅读(8104)  评论(121编辑  收藏  举报