会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
成长的足迹.NET
我的.NET成长之路
博客园
首页
新随笔
联系
订阅
管理
2009年9月2日
分词中常用算法比较与设想
摘要: 与基于理解的分词算法和基于统计的分词算法相比,基于文本匹配的算法更加通用。基于文本匹配的算法又称之为“机械分词算法”,他是它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功,可识别出一个词。按照扫描方向的不同,文本匹配分词方法可以分为正向匹配和逆向匹配两种;按照不同长度优先匹配的情况,可以...
阅读全文
posted @ 2009-09-02 10:51 ejiyuan
阅读(717)
评论(0)
推荐(0)
编辑
公告