基于既定词表的自适应汉语分词技术研究
摘要:我早期的的汉语分词算法研究:基于既定词表的自适应汉语分词技术研究
阅读全文
posted @
2006-10-11 12:48
田野的羽毛
阅读(1142)
推荐(0) 编辑
汉语分词算法简介
摘要:选自:分词技术研究报告(报告人:杨超) 现有的分词算法主要可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。 1、 基于字符串匹配的分词方法 这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不...
阅读全文
posted @
2006-03-30 13:16
田野的羽毛
阅读(1018)
推荐(0) 编辑