摘要: 对于一段英文,如果希望提取其中的的单词,只需要使用字符串处理的split()方法即可,例如“China is a great country”。 然而对于中文文本,中文单词之间缺少分隔符,这是中文及类似语言独有的“分词问题”。 jieba(“结巴”)是python中一个重要的第三方中文分词函数库。j 阅读全文
posted @ 2019-10-18 18:52 丁如超dd 阅读(1958) 评论(2) 推荐(0) 编辑