摘要: 中文自动分词方法分为机械分词和理解性分词两种,目前实用的自动分词系统都是以采用机械分词为主,辅以少量的词法、语法和语义信息的分词系统。理解性分词目前还处于试验阶段。机械分词法机械分词从切分程度或切分策略上看可以分为部分切分和全切分两种。部分切分只取得输入序列的一种货几种可接受的切分形式,全切分则要求获得所有可接受的切分形式。下面就根据传统的习惯,说说部分切分的机械分词法。1.机械分词法的分类根据切取字串的方向,可分为正向匹配法和逆向匹配法。实验证明,逆向匹配法的切分正确率略高于正向匹配法,为便于发现歧义切分,也可降两者有机的结合起来形成双向匹配法。这里也要考虑到两者的词库问题。根据每次匹配时优 阅读全文
posted @ 2013-03-18 16:59 没有理由 阅读(358) 评论(0) 推荐(0) 编辑