一种快速的未登陆词识别方法(原理和实现)
摘要:
一种快速的未登陆词识别方法(原理和实现) 最近网络上关于分词的算法已经很多了,在实际应用中每个人根据对分词的不同理解写了不同的中文分词算法,可谓百花齐放. 但现在似乎还没有针对未登陆词的识别算法,有鉴于此,我特地写了一个,抛砖引玉. 算法的假设: 1. 未登陆词是由单字组成的; 2. 如果一个字同时属于2个未登陆词,那么只选择第一被识别的词; 测试文章: 最近电视剧大长今很火,我就选取了介绍... 阅读全文
posted @ 2005-10-12 16:18 我要去桂林 阅读(663) 评论(1) 推荐(0) 编辑