phantomSuying

2019年11月3日

jieba分词原理-DAG(NO HMM)

摘要: 最近公司在做一个推荐系统,让我给论坛上的帖子找关键字,当时给我说让我用jieba分词,我周末回去看了看,感觉不错,还学习了一下具体的原理 首先,通过正则表达式,将文章内容切分,形成一个句子数组,这个比较好理解 然后构造出句子的有向无环图(DAG) 选出成词概率最大的位置 如上图,蓝色圈中的部分,括号 阅读全文

posted @ 2019-11-03 15:35 phantomSuying 阅读(664) 评论(1) 推荐(1) 编辑

导航