会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
moonsoft
技术交流QQ群:583895157
博客园
首页
新随笔
联系
订阅
管理
2018年7月23日
Lucene——索引过程分析Index
摘要: Lucene索引过程分为3个主要操作步骤:将原始文档转换成文本、分析文本、将分析好的文本保存至索引中 一、提取文本和创建文档 从 pdf、word等非纯文本格式文件中,提取文本格式信息。建立起对应的,包含各个域的文档后,就可以对这些文本信息进行分析。 使用 Tika框架实现 二、分析文档 调用 In
阅读全文
posted @ 2018-07-23 18:23 moonsoft
阅读(409)
评论(0)
推荐(0)
编辑
公告