会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
A_Present
博客园
首页
新随笔
联系
订阅
管理
2018年10月5日
【NLP汉语自然语言处理与实践】分词_笔记
摘要: 一、两种分词标准: 1. 粗粒度。 将词作为最小基本单位。比如:浙江大学。 主要用于自然语言处理的各种应用。 2. 细粒度。 不仅对词汇继续切分,也对词汇内部的语素进行切分。比如:浙江/大学。 主要用于搜索引擎。一种常用方案是: 索引的时候使用细粒度的分词以保证召回,比如浙江/大学 询的时候使用粗粒
阅读全文
posted @ 2018-10-05 16:56 A_Present
阅读(805)
评论(0)
推荐(0)
编辑
公告