上一页 1 2 3 4 5 6 7 ··· 14 下一页
摘要: 1、MapReduce理论简介1.1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。简单地说,MapReduce就是"任务的分解与结果的汇总"。 在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;另一个是 TaskTracker,JobTracker是用于调度工作的,TaskTracker是用于执行工作的。一个Hadoop集群中只有一台 JobTracker。 在分布式计算中 阅读全文
posted @ 2012-12-11 21:38 蜗牛123 阅读(453) 评论(0) 推荐(0) 编辑
摘要: 在计算机技术中,虚拟化(Virtualization)是将计算机物理资源如服务器、网络、内存及存储等予以抽象、转换后呈现出来,使用户可以比原本的组态更好的方式来应用这些资源。这些资源的新虚拟部份是不受现有资源的架设方式,地域或物理组态所限制。一般所指的虚拟化资源包括计算能力和资料储存。[编辑] 虚拟化的类别硬件虚拟化虚拟机(Virtual machine或VM),可以像真实机器一样运行程序的计算机的软件实现平台虚拟化,将操作系统和硬件平台资源分割开完全虚拟化,敏感指令在操作系统和硬件之间被捕捉处理,客户操作系统无需修改,所有软件都能在虚拟机中运行,例如IBM CP/CMS,VirtualBox 阅读全文
posted @ 2012-12-11 17:48 蜗牛123 阅读(372) 评论(0) 推荐(0) 编辑
摘要: 虚拟化是一个广义的术语,在计算机方面通常是指计算元件在虚拟的基础上而不是真实的基础上运行。虚拟化技术可以扩大硬件的容量,简化软件的重新配置过程。CPU的虚拟化技术可以单CPU模拟多CPU并行,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。虚拟化技术与多任务以及超线程技术是完全不同的。多任务是指在一个操作系统中多个程序同时并行运行,虚拟化而在虚拟化技术中,则可以同时运行多个操作系统,而且每一个操作系统中都有多个程序运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上;而超线程技术只是单CPU模拟双CPU来平衡程序运行性 阅读全文
posted @ 2012-12-10 22:07 蜗牛123 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 主要介绍用DataJoin类来链接多数据源,先看一下例子,假设二个数据源customs和orderscustomer ID Name PhomeNumber1 赵一 025-5455-5662 钱二 025-4587-5653 孙三 021-5845-5875客户的订单号:Customer ID order ID Price Data2 1 93 2008-01-083 2 43 2012-01-211 ... 阅读全文
posted @ 2012-12-06 17:36 蜗牛123 阅读(198) 评论(0) 推荐(0) 编辑
摘要: My students frequently ask me how I planned out my career to become president of Fidelity Investments. I always tell them, "There was no grand plan; I backed into my career one step at a time."In the years after I graduated from law school, I had no idea that I would ultimately become the 阅读全文
posted @ 2012-12-05 19:32 蜗牛123 阅读(672) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 14 下一页