摘要: 磁盘阵列简称RAID(Redundant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列主要针对硬盘,在容量及速度上,无法跟上CPU及内存的发展,提出改善方法。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。 磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬 阅读全文
posted @ 2013-01-06 12:31 有心人cwx 阅读(807) 评论(0) 推荐(0) 编辑
摘要: RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案。 以四个硬盘组成的RAID 5为例,其数据存储方式如图4所示:图中,P0为D0,D1和D2的奇偶校验信息,其它以此类推。由图中可以看出,RAID 5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后,利... 阅读全文
posted @ 2013-01-06 12:30 有心人cwx 阅读(741) 评论(0) 推荐(0) 编辑
摘要: 1.首先准备好ant和maven,配置好ANT_HOME和MAVEN_HOME的环境变量,把%ANT_HOME%/bin和%MAVEN/HOME%/bin配置在PATH变量。(貌似如果只是编译eclipse-plugin不用安装maven)我这里的版本是hadoop-core-0.20.2-cdh3u3,其他版本的编译方法也一样。2.在你下载的hadoop根目录下,把hadoop-core-0.20.2-cdh3u3.jar解压到build\classes目录下。3.把hadoop-core-0.20.2-cdh3u3.jar拷贝到build目录下4.从CMD进入到src\contrib\ec 阅读全文
posted @ 2013-01-06 10:25 有心人cwx 阅读(394) 评论(0) 推荐(0) 编辑
摘要: Hadoop的版本0.20.0包含有一个新的 Java MapReduce API,有时也称为"上下文对象"(context object),旨在使API在今后更容易扩展。1. 首先第一条,新旧API不兼容。所以,以前用旧API写的hadoop程序,如果旧API不可用之后需要重写,也就是上面我的程序需要重写,如果旧API不能用的话,如果真不能用,这个有点儿小遗憾!2. 新的API倾向于使用抽象类,而不是接口,使用抽象类更容易扩展。例如,我们可以向一个抽象类中添加一个方法(用默认的实现)而不用修改类之前的实现方法。因此,在新的API中,Mapper和Reducer是抽象类。3 阅读全文
posted @ 2013-01-06 10:21 有心人cwx 阅读(782) 评论(0) 推荐(0) 编辑