摘要: 1.安装部署1.1 环境要求1.使用的JDK的版本必须是1.6或者更高版本,本实例中使用的是JDK1.62.使用的hadoop的版本必须是Hadoop0.20.205.1及以上版本,本实例中使用的是Hadoop1.0.1版本。3.为了运行HICC,需要使用HBase0.90.4版本1.2 版本选择 这里使用0.5版本1.3 执行步骤1.首先下载的chukwa的版本是0.5版本,下载链接如下:http://labs.renren.com/apache-mirror/incubator/chukwa/chukwa-0.5.0/下载如下的两个文件:chukwa-incubating-0.5.0.t. 阅读全文
posted @ 2013-12-02 17:23 wq920 阅读(2628) 评论(0) 推荐(0) 编辑
摘要: FROM:http://go-on.iteye.com/blog/1789466背景 Google、Facebook、Amazon等互联网巨头对于数据的创造性使用,创造出了很多辉煌的商业产品。如Amazon创造出的新的推荐模式:”查询此商品的顾客也查询了。。。。。”、“看过此商品的后的顾客买的其他商品有。。。。。。”、“购买了您最近浏览过的商品的顾客同时购买了。。。。。。”,还有LinkedIn公司创造的“你可能认识的人”。这些机制无不是建立在大量数据分析的基础上。分布式日志方案 作为互联网公司,每天庞大的日志数据将是一笔宝贵的财富,对大规模日志数据进行采集、追踪、处理将是非常有收益的。一.. 阅读全文
posted @ 2013-12-02 16:57 wq920 阅读(11302) 评论(0) 推荐(1) 编辑