会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Wualin
博客园
首页
新随笔
联系
订阅
管理
2019年1月5日
反反爬虫--破解字体加密
摘要: 今天在爬取58同城租房信息的时候发现58同城中的价格在html文档中是以乱码的,但是在页面中是正常显示 字体加密是爬取网页的过程中比较麻烦的问题。 字体加密一般是网页修改了默认的字符编码集,在网页上加载的他们自己定义的字体文件作为字体的样式,可以正确地显示数字,但是在源码上同样的二进制数由于未加载自
阅读全文
posted @ 2019-01-05 22:19 Wualin
阅读(1115)
评论(1)
推荐(1)
编辑
公告