知识点滴

知识是一点一滴地积累的

 

2008年3月18日

汉语分词系统的常用算法

摘要: 常用的分词算法有正向最大匹配、逆向最大匹配、双向最大匹配、最佳匹配法、最少分词法、词网格算法等等。最大匹配法(Forward Maximum Matching method, FMM法):选取包含6-8个汉字的符号串作为最大符号串,把最大符号串与词典中的单词条目相匹配,如果不能匹配,就削掉一个汉字继续匹配,直到在词典中找到相应的单词为止。匹配的方向是从右向左。逆向最大匹配法(Backward Ma... 阅读全文

posted @ 2008-03-18 21:24 阿东 阅读(454) 评论(2) 推荐(0) 编辑

导航