08 2019 档案
摘要:这次去测试一下 python 的set去重,速度怎么样? 我们要做的是把文件一次性读取到内存中,然后去重,输出去重的长度。 第一步:对 121w 条数据去重,看去重话费的时间 上证据: 第二步:对 1210 w 条数据去重,看去重话费的时间 第三步:对 1.21 亿 条数据去重,看去重话费的时间
阅读全文
摘要:这是一个简单的md5加密,可以学习一下js加密的破解流程,当一个入门级的教程 第一步:请求抓包 password是32位的字母和数字组合,猜测可能是md5加密,我们md5在线工具上试一下 发现我们的猜测是完全正确的 第二步:搜索js加密字段 第三步: 静态分析js,打断点 1. 2. 第四步: 扣j
阅读全文
摘要:大众点评评论数据抓取 反爬虫措施有css文字映射和字体库反爬虫 大众点评的反爬虫手段有那些: 封ip,封账号,字体库反爬虫,css文字映射,图形滑动验证码 这个图片是滑动验证码,访问频率高的话,会出现这个滑动验证码 这个图片是店铺失效或者封账号出现的提示 关于大众点评 css文件映射分析: 第一步:
阅读全文
摘要:这是一个rsa加密,并且每次加密候的数据固定不变。 第一步:查看加密字段 第二步:搜索加密参数 第三步:打断点调试 1 2 3. 第四部:js调试工具调试 第五步:源码 function c(a) { var b = f, c = b.biDivideByRadixPower(a, this.k -
阅读全文
摘要:京东登录,有一个参数nloginpwd,是加密字段。 第一步:浏览器抓包 第二部:搜索加密字段 js 代码 第三部: 下断点 2. js代码: var navigator = {}; var window = {}; var Base64 = {}; var ASN1 = {}; var Hex =
阅读全文
摘要:# -*- coding=utf-8-*- from Crypto.Cipher import DES import base64 """ des cbc加密算法 padding : PKCS5 """ class DESUtil: __BLOCK_SIZE_8 = BLOCK_SIZE_8 = DES.block_size __IV = "\0\0\0\0\0\0\0\0" # __IV = c
阅读全文
摘要:AES加密方式有五种:ECB, CBC, CTR, CFB, OFB 从安全性角度推荐CBC加密方法,本文介绍了CBC,ECB两种加密方法的python实现 python 在 Windows下使用AES时要安装的是pycryptodome 模块 pip install pycryptodome py
阅读全文
摘要:AES ECB模式加解密使用cryptopp完成AES的ECB模式进行加解密。 AES加密数据块分组长度必须为128比特,密钥长度可以是128比特、192比特、256比特中的任意一个。(8比特 == 1字节) 在CBC、CFB、OFB、CTR模式下除了密钥外,还需要一个初始化向IV。(ECB模式不用
阅读全文
摘要:第一步: 发现加密 第二部:搜索加密参数 queryId 第三部:找到js核心加密代码 第四部:代码实现 执行结果:
阅读全文
摘要:ASCII码:一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制,最小值-128,最大值127。如一个ASCII码就是一个字节。 UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英
阅读全文
摘要:今天介绍一个简单验证的识别。 主要是标准的格式,没有扭曲和变现。就用 pytesseract 去识别一下。 验证码地址:http://wscx.gjxfj.gov.cn/zfp/webroot/xfsxcx.html 需要识别的验证码是: 因为这个验证码有干扰点,所以直接识别的效果非常不好。 首先对
阅读全文
摘要:今天介绍一个简单验证的识别。 主要是标准的格式,没有扭曲和变现。就用 pytesseract 去识别一下。 验证码地址:http://wsxf.mca.gov.cn/zfp/Random.cmd?d=1565452532947 需要识别的验证码是: 识别结果是: 识别率百分之八十。10个有两个错误。
阅读全文
摘要:今天介绍一个简单验证的识别。 主要是标准的格式,没有扭曲和变现。就用 pytesseract 去识别一下。 验证码地址:https://user.www.gov.cn/sso/verifyimg_edit?rd=0.22469390770687414 需要识别的验证码是: 识别结果是: 识别代码是:
阅读全文
摘要:对于普通的字符型验证码,如果可以分割,那么降噪和二值化以后,就很容易识别了。 这篇博客主演是对验证码进行降噪和二值化。 下面的图片是处理前的验证码和处理后的验证码截图: 下面是登录的验证码: 下面是验证码处理前后的对比 降噪代码不再附加
阅读全文