会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Just do it!
这个人很懒!
博客园
首页
新随笔
联系
订阅
管理
2019年9月11日
jieba源码解析(一):分词之前
摘要: 简介 总的来说,jieba分词主要是基于统计词典,构造一个前缀词典;然后利用前缀词典对输入句子进行切分,得到所有的切分可能,根据切分位置,构造一个有向无环图;通过动态规划算法,计算得到最大概率路径,也就得到了最终的切分形式。 初始化 jieba采用了延迟加载机制,在import后,不会立刻加载词典文
阅读全文
posted @ 2019-09-11 17:55 AloisWei
阅读(2123)
评论(2)
推荐(0)
编辑
公告