会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
BlackStorm
首页
新随笔
联系
订阅
管理
2017年2月1日
python 爬虫爬取内容时, \xa0 、 \u3000 的含义
摘要: 最近用 scrapy 爬某网站,发现拿到的内容里面含有 \xa0 、 \u3000 这样的字符,起初还以为是编码不对,搜了一下才知道是见识太少 233 。 \xa0 是不间断空白符 我们通常所用的空格是 \x20 ,是在[标准ASCII][A1]可见字符 0x20~0x7e 范围内。 而 \xa0
阅读全文
posted @ 2017-02-01 20:43 BlackStorm
阅读(44473)
评论(0)
推荐(5)
编辑
公告