摘要: 正则表达式去除中文字之间的空格,保留英文单词之间的空格,对于英文单词中间夹杂着数字的情况,应该保留空格但没有保留 # -*- coding:utf-8 -*- # import re def _clean_space(text): ​ match_regex = re.compile(u'[\u4e 阅读全文
posted @ 2020-10-29 19:05 cydcyd 阅读(1531) 评论(1) 推荐(1) 编辑
摘要: python不同语言的字符串连接成文本 # -*- coding:utf-8 -*- # import sys import unicodedata import six _ALPHANUMERIC_CHAR_SET = set( six.unichr(i) for i in xrange(sys. 阅读全文
posted @ 2020-10-29 11:33 cydcyd 阅读(85) 评论(0) 推荐(0) 编辑