会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
車輪の唄
博客园
首页
新随笔
联系
订阅
管理
2017年12月20日
Lucene倒排索引原理与实现:Term Dictionary和Index文件 (FST详细解析)
摘要: 有限自动机算法(FST,Finite State Transducer):通过输入有序字符串构建最小有向无环图。通过共享前缀来节省空间,内存存放前缀索引,磁盘存放后缀词块 1、紧凑的结构,通过对词典中单词前缀和后缀的重复利用,压缩了存储空间。 2、O(len(str))的查询时间复杂度。 lucen
阅读全文
posted @ 2017-12-20 10:45 車輪の唄
阅读(147)
评论(0)
推荐(0)
编辑
公告