python匹配某个中文字符
python2.7对中文的支持不好是众所周知的,现在遇到这样一个需求,要匹配某个中文字符。查了一个资料,思路就是转化为unicode进行比较,记录如下:
line = '参考答案: A' # gbk -> unicode # 看需要,这里是把gbk转化为unicode,也可以把utf-8转换为unicode line = line.decode('gbk').strip() # 匹配 '参考答案' 四个字 if re.match(u'^\u53c2\u8003\u7b54\u6848', line): q_answer = line print q_answer
这就ok了.
对了,可以这样查看中文的unicode编码:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步