摘要: python 结巴分词算法:基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG)采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法 阅读全文
posted @ 2015-08-24 14:34 充实自己 阅读(261) 评论(0) 推荐(0) 编辑