随笔分类 -  Indri

Indri入门系列1.1 & 1.2——建立能够为IndexUI.jar理解的TRECWeb格式的文档
摘要:这篇文档算不上一篇完整的blog,只是作为一个小Bug的记录而已,所以取名1.1~在使用IndexUI.jar建立索引的过程中,笔者选择使用了TRECWeb的数据格式,但是发现总是出现一些小问题,不是无法建立索引就是建立的索引只包含一个文档。经过若干轮的折磨,最终发现问题在于,Indri理解的TRECWeb必须是以“\n”来结尾的。。。这是今天的1.2,哈哈笔者使用Indri自带的图形界面IndexUI.jar来建立索引,在编程对索引进行处理时,发现总是无法获得到域内(fields)的值,最开始以为是Indri与Lucene中域的概念不同造成的,并没有进行深入的理解。今天突发奇想,对Index 阅读全文

posted @ 2012-12-01 23:02 韧心 阅读(755) 评论(0) 推荐(0)

Indri入门系列1——在Mac上安装Indri
摘要:Indri是一个不错的搜索引擎,目前关于Indri的中文介绍相对较少,因此介绍在Mac系统上配置Indri的文章就更少,笔者最近正在研究如何使用Indri,结合自己的一点努力,与大家分享一下Indri的相关内容(主要是在Mac系统下面的~)这是本系列的第一部分,主要介绍一下Indri在Mac系统下如何安装,如果有机会,给大家再讲讲如何在Java下面开发Indri1、配置Indri在Mac系统下面进行安装,需要首先进行配置(Linux和Unix下面也是这样的)启动“终端”,将当前目录调整到Indri的根目录下,输入./configure --prefix=<indri的安装目录>-- 阅读全文

posted @ 2012-11-26 17:16 韧心 阅读(1573) 评论(0) 推荐(0)

导航