会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
早起的小虫子
路漫漫其修远兮,吾将上下而求索!
博客园
首页
新随笔
联系
订阅
管理
2021年3月30日
中文分词算法总结
摘要: 中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。现有的分词算法可分为三大类:基于词典的分词方法、基于统计的方法、基于规则的方法。 1 基于词典的分词方法(字符串匹配,机械分词方法) 定义:按照一定策略将
阅读全文
posted @ 2021-03-30 16:57 早起的小虫子
阅读(1540)
评论(0)
推荐(0)
编辑
公告