会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
goodgirlmia's space
博客园
首页
新随笔
联系
管理
订阅
2014年9月30日
lucent检索技术之创建索引:使用POI读取txt/word/excel/ppt/pdf内容
摘要: 在使用lucent检索文档时,必须先为各文档创建索引。索引的创建即读出文档信息(如文档名称、上传时间、文档内容等),然后再经过分词建索引写入到索引文件里。这里主要是总结下读取各类文档内容这一步。一、之前做过一个小工具也涉及到读取word和excel内容,采用的是com组件的方式来读取。即导入COM库...
阅读全文
posted @ 2014-09-30 17:00 goodgirlmia
阅读(971)
评论(0)
推荐(0)
编辑
公告
作者:goodgirlmia 本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。