大众点评字体爬取

通过网站头部的css链接每次下载不同的woff字体文件，通过TTfont打开对数字进行匹配即可完成对于字体的破解，

有两种方案，一种式直接从response.text 替换其所有含上述字体的字符完成替换后再通过 etree.HTML( ) 打开.text 对象再去完成xpath查询

　　　　　　一种就是直接先查取对象这里不能单个提取，因为元素全部分开且单个提取后的乱码无法解析（因为有\）然后通过extract() 全部截取 [' ', ' ' ]类型

　　　　　　通过对于列表元素中，replace 掉\，再于字体中的对象字典进行匹配即可得出值，如果想让列表变为单个字符串可以用：先遍历元素 data = ''.join(data)

两只关键是在字体文件woff里面提取出键值对！：

其主要函数就是：

posted @ 2020-08-15 23:10 酸辣土豆皮阅读(144) 评论(0) 收藏举报

刷新页面返回顶部

酸辣土豆皮