【别问系列】大众点评 商家详情页 加密数据解码
别问,看。
大众点评的网页地址:
http://www.dianping.com/shop/G6LElBf9f5vcLmw3
爬虫获取的html源码:
被加密了,采用了woff字体文件进行映射,需要获取字体文件,查看woff:在html头部有个css连接:
<link rel="stylesheet" type="text/css" href="//s3plus.meituan.net/v1/mss_0a06a471f9514fc79c981b5466f56b91/svgtextcss/fe0442f34a887eb95c4422a7a612e517.css">
打开看到:
这些就是解码文件,下载到本地。然后进入下面网站:
http://blog.luckly-mjw.cn/tool-show/iconfont-preview/index.html
打开7c4ff942.woff、278d416d.woff,看到:
这个就是解密的密码表。比如html文件的:
泡泡玛<e class="address"></e>
就是泡泡马特