会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
喵改
博客园
首页
新随笔
联系
订阅
管理
2020年4月26日
自然语言处理之HMM模型分词
摘要: 汉语中句子以字为单位的,但语义理解仍是以词为单位,所以也就存在中文分词问题。主要的技术可以分为:规则分词、统计分词以及混合分词(规则+统计)。 基于规则的分词是一种机械分词,主要依赖于维护词典,在切分时将与剧中的字符串与词典中的词进行匹配。主要包括正向最大匹配法、逆向最大匹配法以及双向最大匹配法。
阅读全文
posted @ 2020-04-26 22:22 喵改
阅读(1158)
评论(0)
推荐(0)
编辑
公告