会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
geekbyte
博客园
首页
新随笔
联系
管理
2021年8月4日
python爬虫 -- 处理emoji表情符导致xpath无法正常解析网页的问题
摘要: 前言 本篇文章很短,就是记录一个偶然遇到的问题 问题复现 是这样的,在用xpath解析某网站的时候,由于网站数据格式是普通的html,而非json字符串,所以只能解析DOM对象,有的能用正则表达式的我都尽量用正则表达式了,没法用正则的我都用beautifulsoup库或者pyquery了,但是没法,通用型还是没法跟xpath比,而且我已经写好一版,在有限的时间改的话就很烦了 不多说,先看问题
阅读全文
posted @ 2021-08-04 11:00 Eeyhan
阅读(661)
评论(0)
推荐(1)
编辑
公告