摘要: 分词,即将连续的字序列按照一定的规范重新组合成词序列的过程,它是一种自然语言处理技术,这里的分词指中文分词,其本质是提取一个字符串中的词组或者字。 其详细代码非常简单,如下: #导入jieba分词模块import jieba#记录输入的文件路径filepath = input('请输入要读取的文件: 阅读全文
posted @ 2020-05-08 23:11 夏日的向日葵 阅读(3679) 评论(0) 推荐(0) 编辑