图画hadoop -- 生态圈

 

Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。
Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。
Hiho和sqoop将数据加载到HDFS中。
Oozie是Java Web应用程序。它可以把多个Map/Reduce作业组合到一个逻辑工作单元中,从而完成更大型的任务。
Hbase是一个分布式的、面向列的开源数据库。
Intellicus具有先进的UI报表功能的BI工具。

posted on 2013-09-18 10:38  getclass  阅读(478)  评论(0编辑  收藏  举报

导航