Python 中文字符串长度读取不一致解决

网络请求获取的数据"综合保险公司"

读取长度时,并非6,而是18.

查看了原始数据,原来是u'\u7efc\u5408\u4fdd\u9669\u516c\u53f8' 

使用.decode('utf-8')  进行解码,重新获取长度,结果正常显示为6.

 

另外re模块中,涉及到中文匹配,一定要注意 待匹配 和匹配字段的编码格式是否一致,不要被IDE骗了.

posted @ 2017-12-19 16:32  一路漂泊  阅读(4139)  评论(0编辑  收藏  举报