Fork me on GitHub

随笔分类 -  爬虫相关

爬虫相关技能总结,注意部分文章具有时效性,目标网站可能改版。
摘要:难度:★☆☆☆☆ 1星 一、目标 二、分析 三、编码实现 请注意爬虫文章具有时效性,本文写于2020-11-17日。 阅读全文
posted @ 2020-11-25 20:17 CC11001100 阅读(824) 评论(0) 推荐(0) 编辑
摘要:难度:★☆☆☆☆ 1星 一、目标 目标网站: https://www.500d.me/login/登录的时候提交表单里密码字段enPassword是被加密的:本次目标就是破解这个参数加密。 二、分析 打开登录页:https://www.500d.me/login/打开开发者工具,切换到Network 阅读全文
posted @ 2020-11-25 20:02 CC11001100 阅读(865) 评论(1) 推荐(1) 编辑
摘要:难度: ★☆☆☆☆ 1星 一、缘起 二、分析 三、编码实现 请注意爬虫文章具有时效性,本文写于2020-11-25日。 阅读全文
posted @ 2020-11-25 19:44 CC11001100 阅读(1837) 评论(0) 推荐(0) 编辑
摘要:发现有些网站的编码方式比较特殊,使用requests直接请求拿response.text是得不到正确的文本的,比如这个网站: 阅读全文
posted @ 2020-11-25 19:38 CC11001100 阅读(1192) 评论(1) 推荐(1) 编辑
摘要:难度: ★☆☆☆☆ 1星 一、目标 二、分析 三、编码实现 阅读全文
posted @ 2020-11-25 19:08 CC11001100 阅读(1098) 评论(0) 推荐(1) 编辑
摘要:难度: ★☆☆☆☆ 1星 一、目标 目标网站:https://www.baibianip.com/home/free.html在这个网站的IP列表中的IP地址,是通过JS解密出来的:查看源代码(view-source:https://www.baibianip.com/home/free.html) 阅读全文
posted @ 2020-11-25 18:57 CC11001100 阅读(695) 评论(0) 推荐(0) 编辑
摘要:难度: ☆☆☆☆☆ 0星 一、目标 这个链接是一个代理列表:http://3bodyhome.com/proxy正常的来讲应该是有数据的,但是不知道为啥这里没有,可能是挂了,不过这个不是重点,打开开发者工具,看下Network里有个接口:http://3bodyhome.com/proxy?page 阅读全文
posted @ 2020-11-25 18:46 CC11001100 阅读(525) 评论(0) 推荐(0) 编辑
摘要:难度: ★☆☆☆☆ 1星 阅读全文
posted @ 2020-11-25 18:21 CC11001100 阅读(637) 评论(0) 推荐(0) 编辑
摘要:难度: ★☆☆☆☆ 1星 阅读全文
posted @ 2020-11-25 18:13 CC11001100 阅读(1726) 评论(0) 推荐(0) 编辑
摘要:难度: ☆☆☆☆☆ 0星 阅读全文
posted @ 2020-11-25 17:59 CC11001100 阅读(3504) 评论(0) 推荐(0) 编辑
摘要:买域名的时候看到的一个验证码,感觉蛮有意思的(https://www.namesilo.com/create_account.php),这个质感看上去就不一样:查看页面源码,果然这个验证码是用html的标签拼接出来的:当然这种验证码是比较容易破解的,它是请求这个接口拿到的验证码html数据:https://www.namesilo.com/captcha_generate.php返回的数据被url... 阅读全文
posted @ 2020-02-27 23:07 CC11001100 阅读(867) 评论(0) 推荐(0) 编辑
摘要:这是个非常非常简单的js加密链接。 这是一个导航网站,实际链接到的网站的url被加密了,并没有直接显示在页面上,首先开发者模式选中链接元素: 发现这个链接有一个onclick事件,是调用了visit方法传入了一个很长的看上去像是base64的字符串,猜测实际的url应该就是根据这个字符串生成的,但是 阅读全文
posted @ 2020-02-20 20:07 CC11001100 阅读(3602) 评论(0) 推荐(0) 编辑
摘要:一、脚本之家的在线工具 有时候开发了一款web在线使用的工具,比如类似在线base64编码解码之类的,或者其它的比较有意思的小工具,可能就被别人瞄上盗走源码据为己有了,为了与“盗码者”做斗争,开发者就想各种招数去保护自己的代码,脚本之家也有一套在线工具,使用了比较简单的方式去检测盗用代码,这次就来看 阅读全文
posted @ 2020-02-20 20:05 CC11001100 阅读(638) 评论(0) 推荐(0) 编辑
摘要:一、缘起无聊想玩搜个游戏玩,看到一个帖子引起了我的好奇:但是作者分享的游戏链接已经挂掉了,于是就搜索了一下:选了7k7k上的一个在线玩,链接:http://www.7k7k.com/swf/153466.htm,但是悲剧的是这哥们跳楼的决心很强,不管好说歹说愣是不听不听王八念经,坚信纵身一跃能够解决所有烦恼,搞得我很郁闷,于是就想扒拉出源代码看看这个sb的逻辑到底是啥,咋这么油盐不进呢。二、分析7... 阅读全文
posted @ 2019-11-25 01:55 CC11001100 阅读(1144) 评论(1) 推荐(0) 编辑
摘要:一、缘起想做的事情太多,计划乱糟糟,想找个工具理一下,想起来了的很久之前用过teambition,打算看一下,然后在登录界面看到一个比较有意思的验证码:这种倒是比较有意思哈,看着像是模仿12306的那种,12306的破不了(我真人都要刷几次才能对。。。),这个简单版的还破不了吗,于是激发了我强烈的破解兴趣。二、分析打开开发者工具,先选中看一下先: 首先比较雷的是“地球”竟然是文本显示在页面上的,这... 阅读全文
posted @ 2019-11-20 23:36 CC11001100 阅读(1085) 评论(0) 推荐(0) 编辑
摘要:一、背景介绍 最开始接触验证码破解的时候就是破解的w3cschool的使用手机号找回密码页面的验证码,详见:验证码识别之w3cschool字符图片验证码(easy级别),这次破解一下他们注册页面的滑块验证码,有点忐忑,我这么跟人过不去不会被打吧... 阅读前请知悉:本篇文章只涉及到滑块验证码的滑块位置识别,主要知识集中在图像处理方面,并不涉及到模拟鼠标轨迹等知识。 二、分析 首先打开这个页... 阅读全文
posted @ 2018-12-19 00:13 CC11001100 阅读(3381) 评论(1) 推荐(2) 编辑
摘要:一、前言 自如房屋详情页的价格字段用图片显示,特此破解一下以丰富一下爬虫笔记系列博文集。 二、分析 & 实现 先打开一个房屋详情页观察一下; 网页的源代码中没有直接显示价格字段,价格的显示是使用一张背景图,图上是0-9十个数字,然后网页上显示的时候价格的每一个数字对应着一个元素,元素的背景图就设置为这张图片,然后使用偏移定位到自己对应的数字: 就拿上面这个例子来说,它对应的背景图是:... 阅读全文
posted @ 2018-12-15 21:22 CC11001100 阅读(1615) 评论(0) 推荐(1) 编辑
摘要:一、Socks5协议简介 socks5是基于传输层的协议,客户端和服务器经过两次握手协商之后服务端为客户端建立一条到目标服务器的通道,在传输层转发TCP/UDP流量。 关于socks5协议规范,到处都可以找到,我再重复一遍也没啥意思,因此不再赘述,可以参见rfc1928(英文),或者查阅维基百科SOCKS5 - 维基百科(中文)。 二、代码实现 基于socks5进行了一个代理服务器的简单实... 阅读全文
posted @ 2018-11-12 22:55 CC11001100 阅读(21300) 评论(1) 推荐(1) 编辑

点击右上角即可分享
微信分享提示