Fork me on GitHub
摘要: 1、Nutch简介 Nutch是一个由Java实 现的,开放源代码(open-source)的web搜索引擎。主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的接口来对其网页数据进行 查询的一套工具。其底层使用了Hadoop来做分布式计算与存储,索引使用了Solr分布式索引框架来做,S... 阅读全文
posted @ 2015-05-15 15:35 何海洋 阅读(8169) 评论(0) 推荐(0) 编辑