添加自定义字段至Solr 的 ExtractingRequestHandler

利用SolrJ 上传文件至Solr进行索引,比如索引一个test.pdf文件,我想在索引里添加一个文件名的字段,我在manager-schema里添加了一个字段,为“fileName”, 然后按照 guideline(http://wiki.apache.org/solr/ExtractingRequestHandler) 所说的,添加了literal.fileName 的参数,可是虽然索引成功了,可是一查询,并没有fileName这个字段,郁闷了,明明说可以添加的啊,怎么就没有了呢?仔细看了一下,注意到uprefix=<prefix>这个属性,看了下我的solrconfig.xml里关于ExtractingRequestHandler的配置,这个属性配置的是uprefix=ignore_,说明所有不是Tika解析出来的字段都被忽略掉了。一开始以为是这个原因,我就把uprefix改成attr_,这个字段不会忽略,重新索引一下,这回看到了好多先前没看到的字段(以attr_开头),还是没看到fileName字段,简直心灰意冷。难道我不经意间发现了一个bug?可是想想,应该不会这么搓的。于是又仔细看了一下那些以“attr_”开头的字段,发现有一个“attr_filename”的字段,我晕,不会是大小写的问题吧。于是把uprfix改回“ignore_”,把fileName改成filename,重新索引一下,哈哈,成功了。 

posted @ 2016-09-07 15:45  一剑侵心  阅读(1573)  评论(0编辑  收藏  举报