python匹配某个中文字符

python2.7对中文的支持不好是众所周知的,现在遇到这样一个需求,要匹配某个中文字符。查了一个资料,思路就是转化为unicode进行比较,记录如下:

复制代码
line = '参考答案: A'
# gbk -> unicode
# 看需要,这里是把gbk转化为unicode,也可以把utf-8转换为unicode
line = line.decode('gbk').strip()

# 匹配 '参考答案' 四个字
if re.match(u'^\u53c2\u8003\u7b54\u6848', line):
   q_answer = line
   print q_answer
复制代码

这就ok了.

对了,可以这样查看中文的unicode编码:

 

posted on   留校察看  阅读(6485)  评论(0编辑  收藏  举报

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示