筛选出一段文字中的中文

复制代码
import re

comments ="abc大家好,浙江省,杭州市,西溪湿地"
pattern = re.compile(r'[\u4e00-\u9fa5]+')
filterdata = re.findall(pattern, comments)
print(filterdata)
# ['大家好', '浙江省', '杭州市', '西溪湿地']
# 连接所有中文 
resultdata = ''.join(filterdata)
print(resultdata)
# 大家好浙江省杭州市西溪湿地
复制代码

 

取出文档中的中文

 

待续。。。

posted @   宝山方圆  阅读(2671)  评论(0编辑  收藏  举报
努力加载评论中...
点击右上角即可分享
微信分享提示