摘要: 今天在爬取58同城租房信息的时候发现58同城中的价格在html文档中是以乱码的,但是在页面中是正常显示 字体加密是爬取网页的过程中比较麻烦的问题。 字体加密一般是网页修改了默认的字符编码集,在网页上加载的他们自己定义的字体文件作为字体的样式,可以正确地显示数字,但是在源码上同样的二进制数由于未加载自 阅读全文
posted @ 2019-01-05 22:19 Wualin 阅读(1115) 评论(1) 推荐(1) 编辑