python匹配某个中文字符

python2.7对中文的支持不好是众所周知的，现在遇到这样一个需求，要匹配某个中文字符。查了一个资料，思路就是转化为unicode进行比较，记录如下：

line = '参考答案: A'
# gbk -> unicode
# 看需要，这里是把gbk转化为unicode，也可以把utf-8转换为unicode
line = line.decode('gbk').strip()

# 匹配 '参考答案' 四个字
if re.match(u'^\u53c2\u8003\u7b54\u6848', line):
   q_answer = line
   print q_answer

这就ok了.

对了，可以这样查看中文的unicode编码：

posted on 2017-02-20 10:54 留校察看阅读(6485) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

留校察看

python匹配某个中文字符

导航

公告