摘要: 1、MapReduce理论简介1.1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。简单地说,MapReduce就是"任务的分解与结果的汇总"。 在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;另一个是 TaskTracker,JobTracker是用于调度工作的,TaskTracker是用于执行工作的。一个Hadoop集群中只有一台 JobTracker。 在分布式计算中 阅读全文
posted @ 2012-12-11 21:38 蜗牛123 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 在计算机技术中,虚拟化(Virtualization)是将计算机物理资源如服务器、网络、内存及存储等予以抽象、转换后呈现出来,使用户可以比原本的组态更好的方式来应用这些资源。这些资源的新虚拟部份是不受现有资源的架设方式,地域或物理组态所限制。一般所指的虚拟化资源包括计算能力和资料储存。[编辑] 虚拟化的类别硬件虚拟化虚拟机(Virtual machine或VM),可以像真实机器一样运行程序的计算机的软件实现平台虚拟化,将操作系统和硬件平台资源分割开完全虚拟化,敏感指令在操作系统和硬件之间被捕捉处理,客户操作系统无需修改,所有软件都能在虚拟机中运行,例如IBM CP/CMS,VirtualBox 阅读全文
posted @ 2012-12-11 17:48 蜗牛123 阅读(369) 评论(0) 推荐(0) 编辑