会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
夏日的向日葵
博客园
首页
新随笔
联系
订阅
管理
2020年5月8日
python对读取的文件内容进行分词
摘要: 分词,即将连续的字序列按照一定的规范重新组合成词序列的过程,它是一种自然语言处理技术,这里的分词指中文分词,其本质是提取一个字符串中的词组或者字。 其详细代码非常简单,如下: #导入jieba分词模块import jieba#记录输入的文件路径filepath = input('请输入要读取的文件:
阅读全文
posted @ 2020-05-08 23:11 夏日的向日葵
阅读(3679)
评论(0)
推荐(0)
编辑
公告