2013年9月18日

图画hadoop -- 生态圈

摘要: Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。Hiho和sqoop将数据加载到HDFS中。Oozie是Java Web应用程序。它可以把多个Map/Reduce作业组合到一个逻辑工作单元中,从而完成更大型的任务。Hbase是一个分布式的、面向列的开源数据库。Intellicus具有先进的UI报表功能的BI工具。 阅读全文

posted @ 2013-09-18 10:38 getclass 阅读(478) 评论(0) 推荐(0) 编辑

导航