筛选出一段文字中的中文

import re

comments ="abc大家好,浙江省,杭州市,西溪湿地"
pattern = re.compile(r'[\u4e00-\u9fa5]+')
filterdata = re.findall(pattern, comments)
print(filterdata)
# ['大家好', '浙江省', '杭州市', '西溪湿地']
# 连接所有中文 
resultdata = ''.join(filterdata)
print(resultdata)
# 大家好浙江省杭州市西溪湿地

 

取出文档中的中文

 

待续。。。

posted @ 2017-07-19 23:26  宝山方圆  阅读(2668)  评论(0编辑  收藏  举报