摘要: 启发式规则: 1.如果正反向分词结果词数不同,则取分词数量较少的那个。 2.如果分词结果词数相同 a.分词结果相同,就说明没有歧义,可返回任意一个。 b.分词结果不同,返回其中单字较少的那个。算法描述:S1为带切分字符串,FMM为S1正向最大匹配切分结果,BMM为S1逆向最大匹配切分结果如果FMM和... 阅读全文
posted @ 2015-05-25 20:30 搞不清算法 阅读(698) 评论(0) 推荐(0) 编辑
摘要: 算法描述:S1为带切分字符串,S2为空,MaxLen为词典中的最大词长判断S1是否为空,若是则输出S2从S1右边开始,取出待处理字符串str(其中str的长度小于MaxLen)查看str是否在词典中,若是则转5,若否则转6S2+=str+”/”,S1-=str,转2将str最左边的一个字去掉判断st... 阅读全文
posted @ 2015-05-25 20:27 搞不清算法 阅读(2568) 评论(0) 推荐(0) 编辑
摘要: 算法描述:S1为带切分字符串,S2为空,MaxLen为词典中的最大词长判断S1是否为空,若是则输出S2从S1左边开始,取出待处理字符串str(其中str的长度小于MaxLen)查看str是否在词典中,若是则转5,若否则转6S2+=str+”/”,S1-=str,转2将str最右边的一个字去掉判断st... 阅读全文
posted @ 2015-05-25 20:26 搞不清算法 阅读(2035) 评论(0) 推荐(1) 编辑