会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
black2bi
博客园
首页
新随笔
联系
订阅
管理
2023年9月5日
自然语言的处理 nlp
摘要: 分词 得到语言首先使用分词机器进行分词 首先使用正则表达式过滤标点 空格,一般使用NLTK进行首次分词 n-gram 相邻的词组成短语,更有意义。 停用词的过滤 a an the of之类 大小写转换 词干还原house houses houseing 还原成house ,nltk.stem.por
阅读全文
posted @ 2023-09-05 22:45 black2bi
阅读(10)
评论(0)
推荐(0)
编辑