Fork me on GitHub
摘要: 对于英文文本,句子中的词汇可以通过空格很容易得进行划分,但是在我们中文中则不然,没有明显的划分标志,所以需要通过专门的方法(算法)进行分词。在Python中,有多种库实现了各种方法支持中文分词,例如:jieba、hanlp、pkuseg等。在本篇中,先来说说jieba分词。 阅读全文
posted @ 2020-08-18 07:15 奥辰 阅读(5111) 评论(0) 推荐(2) 编辑