会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Sean
首页
新随笔
联系
订阅
管理
2015年9月8日
[NLP]文本去除非汉字字符
摘要: 最近有个需求就是去除一个文本里面所有的非汉字字符。 unicide的汉字有个范围u4e00-u9fa5。所以这个范围内的留下来就可以了。 1 blog=u"【雅虎开始提示Chrome用户“升级”到Firefox】http://t.cn/RzHTFF5 国外有关浏览器、搜索引擎那些事儿,也是刀光剑影,
阅读全文
posted @ 2015-09-08 13:56 Sean_le
阅读(618)
评论(0)
推荐(0)
编辑