JS加密
JS加密
在诸多的网站中做爬虫,有非常多的源码是经过js加密处理,通用的方法就是分析js的加密过程,然后用python模拟加密,最后得到自己想要的数据。
例如 案例里面的有道翻译
通过抓包分析发现,js加密的sign数据可以使用一下方式生成
In [6]: from hashlib import md5
In [7]: s = md5()
In [8]: s.update("123456".encode())
In [9]: s.hexdigest()
Out[9]: 'e10adc3949ba59abbe56e057f20f883e'
pyexecjs库
该库可以运行JavaScript的代码,极大的简化了python实现js加密的过程
1. 环境
linux
pip install pyexecjs
# 第三方库
sudo apt-get install nodejs
# JavaScript的运行环境
windows
pip install pyexecjs
2. 示例
In [1]: import execjs
In [2]: js = "'red yellow green blue'.split(' ')"
In [3]: print(execjs.eval(js))
['red', 'yellow', 'green', 'blue']
在爬虫中遇到的很多都是封装好的函数,所以在python中执行一下JavaScript函数
import execjs
js = """
function fun1(a, b) {
s = a * b;
return s
}
"""
ctx = execjs.compile(js)
result = ctx.call("fun1", 2, 3)
print(result)