摘要: 一、Ganglia简介Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据(如处理器速度、内存使用量等)的名为 gmond 的守护进程。它将从操作系统和指定主机中收集。接收所有度量数据的主机可以显示这些数据并且可以将这... 阅读全文
posted @ 2015-11-26 17:10 数据手艺人 阅读(746) 评论(0) 推荐(0) 编辑
摘要: Ganglia是一个监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标。Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通... 阅读全文
posted @ 2015-11-26 17:00 数据手艺人 阅读(1164) 评论(0) 推荐(0) 编辑
摘要: 向任务传递定制参数获取任务待定的信息生成多个输出与关系数据库交互让输出做全局排序1、向任务传递作业定制的参数在编写Mapper和Reducer时,通常会想让一些地方可以配置。例如第5章的联结程序被固定地写为取第一个数据列作为联结键。如果用户可以在运行时指定某个列作为联结键,就会让程序更具普适性。ha... 阅读全文
posted @ 2015-11-26 12:51 数据手艺人 阅读(946) 评论(0) 推荐(1) 编辑