防止抓取页面的数据

从程序上

1、判断用户代理

2、判断ip的访问速度、或者sessionid的访问速度

3、判断请求来源及上级来源

4、客户端通过js自动生成cookie(时间戳和session的加密),后台判断

5、验证码

6、多次不同session判断

从页面上

1、数据随机排序

2、标签中加入随机字符

3、加入随机注释的标签打乱页面组合,加大抓取难度

 

总之尽量不要有规律。

 

 

----未完待续----

posted @ 2015-11-13 18:20  到站了  阅读(749)  评论(0编辑  收藏  举报