摘要:
正则表达式去除中文字之间的空格,保留英文单词之间的空格,对于英文单词中间夹杂着数字的情况,应该保留空格但没有保留 # -*- coding:utf-8 -*- # import re def _clean_space(text): match_regex = re.compile(u'[\u4e 阅读全文
摘要:
python不同语言的字符串连接成文本 # -*- coding:utf-8 -*- # import sys import unicodedata import six _ALPHANUMERIC_CHAR_SET = set( six.unichr(i) for i in xrange(sys. 阅读全文