nevergiveupzeng

导航

2015年5月9日 #

Apache tica详述

摘要: Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI,Pdfbox并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。在当前的0.2-SNAPSHOT版本中, Tika提供了对如下... 阅读全文

posted @ 2015-05-09 22:05 nevergiveupzeng 阅读(540) 评论(0) 推荐(0) 编辑