mephisto’blog

二人行,也有吾师!
Fork me on GitHub

我是怎么处理其他网站恶意爬虫博客园的,希望大家喜欢

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

阅读目录

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

 

介绍

  今天才写了个随笔,然后不到一个小时就有个网站进行了爬虫,呵呵好速度,而已百度的搜索排名比博客园还高,不过我加了防伪处理,大家看看效果吧。

现象

 百度搜索情况:

  看到没别人的网站排名还在前面。

    博客园的:

  

  然后再看看爬虫网站的:

 

  看到框出来的地方没,是不是很有意思,让别人一眼就知道是从哪来的,还能给博客园做广告,博客园得谢谢我们这些攻城狮。求感谢!!

版权处理

  我们怎么来加入版权处理捏。有很多方法。因为爬虫不可能把你这个网站的css和js全部给你爬过来,那整个网站就很臃肿了,还可能出问题,所以这里就有两种处理方法。

一种是js处理,另一种就是css处理。我觉得css处理比较简便,也不影响速度,就采取了css的处理。

  首先我们可以在 管理->选项->博客设置->页面定制CSS代码,如下:

在css中加入此段(红色方块)

  然后我们就可以愉快的在随笔中使用这个div的class了。

  我们在随笔中,随便那些地方,肆意妄为的加入这个就行了,然后其他爬虫网站就只能给我们做广告了,是不是小激动一下。当然这个处理比较简单,也比较容易编辑,大家有什么其他的好的想法也可以交流交流,毕竟知识也是有产权的,毕竟是一个字一个字码出来的,希望那些骗流量的网站积点功德。

 

今天又在网上搜了下,发现有4,5个网站在爬,其中有一个过滤做的很好,居然把那个div的内容过滤了,还是给大家看下吧。

--------------------------

-----------------------------

------------------------

  最后一个明显爬网很成功啊,希望博友们发挥下智慧,一起交流交流。

 

 

 

 

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

posted @   sinodzh  阅读(8109)  评论(121编辑  收藏  举报
编辑推荐:
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
阅读排行:
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· 没有源码,如何修改代码逻辑?
· NetPad:一个.NET开源、跨平台的C#编辑器
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验

点击右上角即可分享
微信分享提示