摘要: 根据2元统计语言模型,最优可能的一种划分s1,s2,..sn 满足下面的值最大:P(s) = max(p(s1) * p(s2|s1)* ... * p(sn|sn-1);一般两边取对数 lnp(s) = max(ln(p(s1)) + ln(p(s2|s1)) + ... + ln(p(sn|sn-1)))那么一条路径的长度为:wi = ln(p(si|si-1))但是,在中科院分词系统的源代码... 阅读全文
posted @ 2009-08-04 16:59 暮夏 阅读(736) 评论(0) 推荐(0) 编辑