摘要: Lucene索引过程分为3个主要操作步骤:将原始文档转换成文本、分析文本、将分析好的文本保存至索引中 一、提取文本和创建文档 从 pdf、word等非纯文本格式文件中,提取文本格式信息。建立起对应的,包含各个域的文档后,就可以对这些文本信息进行分析。 使用 Tika框架实现 二、分析文档 调用 In 阅读全文
posted @ 2018-07-23 18:23 moonsoft 阅读(409) 评论(0) 推荐(0) 编辑