摘要:
ES(elasticsearch)的suggester共有四类(term suggester,phrase suggester,completion suggester,context suggester), 其中completion suggester作为搜索框中的自动补齐功能,尤为常用。本文将用... 阅读全文
摘要:
最近,因为未来工作的需要,我尝试安装部署了分布式爬虫系统Nutch,并配置了伪分布式的Hadoop来存储爬取的网页结果,用solr来对爬下来的网页进行搜索。我主要通过参考网上的相关资料进行安装部署的。但网上的资料很多比较乱,我也走了一些弯路。下面将我的安装过程记录下来,供大家参考。不足之处,请大家批评指正。环境:操作系统是Ubuntu10.04,jdk是openjdk-7-jdk。一、安装nutch1.6 我曾直接下载部署nutch1.6的二进制文件,虽然可以成功爬取网页,但用solr来搜索下载好的网页时,总是无法成功。后来选择下载nutch1.6的源文件自己编译,则可以很好的和solr结.. 阅读全文
摘要:
高考填报志愿时,糊里糊涂地选择了计算机这条不归路。掐指算来,已经8载有余。回头看看,发现这个选择并不坏,至少现在的我喜欢这个行当。都说计算机是一个更新换代很快的专业,总是要学习新的知识。这一点恰恰符合我“喜新厌旧”的口味。面对新的技术、新的知识,我会感觉到自己的浅薄。那一刻我是孤独的,但我很享受。 本科四年,我一直怀着一颗上进的心度过,每天早出晚归,从来不和别人成群结队。我要制造孤独。虽然当时的我对计算机并没有如何沉迷。无奈自己的浮躁总能在有的时候占领上风,考研的路上,我走的并不是很顺。 读研之后,我越发觉得计算机这个领域是多么的神奇,渐渐开始喜欢上她。科研三年,水了论文数篇,我... 阅读全文