python中字符串的处理总结
在爬取新浪财经7*24直播中, 遇到了Unicode编码中文转utf-8的问题, 采用如下代码可以实现转化
>>> a='\\u76d1\\u7ba1\\u5bf929' >>> a '\\u76d1\\u7ba1\\u5bf929' >>> a=a.encode('latin-1').decode('unicode_escape') >>> a '监管对29'
在转换中遇到\/的显示问题, 采用如下方法解决
li = re.sub(r'\\/', '/', li) # 先剔除类似'\u5143GBP\/USD\u77ed'中\/的\,避免误伤其他的\
具体案例可见我的gitee
https://gitee.com/bob1112/pythonPaChong/blob/master/sina_spider.py