随笔分类 -  云计算分布式大数据Hadoop实战高手之路---从零开始

王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”带领您无痛入门Hadoop并能够处理Hadoop工程师的日常编程工作。
摘要:这一讲我们主要剖析MapReduce的原理机制和流程。 “云计算分布式大数据Hadoop实战高手之路”之完整发布目录 云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云计算实战性资料,欢迎大家加入! 关于MapReduce,你至少需要知道以下几点: 1, MapReduce是运行于分布式文件系统之上的,在Hadoop中就是运行于HDFS之上的; 2, MapReduce主要用于大规模数据的并行运算,这种大数据通过指1TB以上; 3, MapReduce的运行原理是把一个大任务切割成很多并行运行的小任务,然后合并小任务运行完后的结果,从而得到最终结果; 阅读全文
posted @ 2013-06-21 15:42 王家林的Hadoop之旅 阅读(1139) 评论(2) 推荐(2) 编辑
摘要:在前面我们安装单机版Hadoop以及Hadoop集群的时候,我们使用的只是可以工作的最小化配置项,有很多重要的配置项都还没有提及。 阅读全文
posted @ 2013-06-19 22:20 王家林的Hadoop之旅 阅读(717) 评论(0) 推荐(2) 编辑
摘要:王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第九讲Hadoop图文训练课程:剖析NameNode和Secondary NameNode的工作机制和流程 阅读全文
posted @ 2013-06-19 18:41 王家林的Hadoop之旅 阅读(813) 评论(0) 推荐(2) 编辑
摘要:本讲通过实验的方式讲解Hadoop文件系统的操作。 云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云计算实战性资料,欢迎大家加入! 首先我们看一些比较常用的Hadoop文件系统的操作命令: 阅读全文
posted @ 2013-06-19 16:37 王家林的Hadoop之旅 阅读(696) 评论(0) 推荐(4) 编辑
摘要:这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群,主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程。 阅读全文
posted @ 2013-06-18 10:06 王家林的Hadoop之旅 阅读(834) 评论(0) 推荐(11) 编辑
摘要:这一讲主要使用HDFS命令行工具操作Hadoop分布式集群初体验: Step 1:使用HSFS命令向Hadoop分布式集群存放一个大文件; Step 2:删除文件并用两份副本在HDFS上存放数据; 阅读全文
posted @ 2013-06-15 12:20 王家林的Hadoop之旅 阅读(857) 评论(2) 推荐(21) 编辑
摘要:王家林 第四讲Hadoop图文训练课程:实战构建真正的Hadoop分布式集群环境Hadoop集群搭建的过程中出现的问题,具体的解决步骤是: Step 1:查询Hadoop的日志看出错原因在哪里; Step 2:停止集群工作; Step 3:根据日志指出的原因进行解决,针对我们这里的问题,需要清空hadoop.main机器的hadoop根目录下的hdfs下的data文件; Step 4:再次启动集群; Step 5:进入hadoop.main的hdfs的web监控页面 Step 6:成功解决问题,若没有成功,重复Step 1~Step 5知道成功。 具体的34页的PDF版本实战构建真正的Hadoop分布式集群环境教程请猛击这里。 阅读全文
posted @ 2013-06-14 23:40 王家林的Hadoop之旅 阅读(1993) 评论(6) 推荐(77) 编辑
摘要:这一讲我们构建真正的Hadoop分布式集群环境: 1, 在VMWare 中准备第二台运行Ubuntu系统的机器; 2, 按照配置伪分布式模式的方式配置新创建运行Ubuntu系统的机器; 3, 配置Hadoop分布式集群环境; 4, 测试Hadoop分布式集群环境; PS:为何搭建Hadoop分布式集群环境只用两台机器呢?原因如下: 1, 两台机器可以让人人皆可成功配置Hadoop集群运行环境,不会因为现有的机器内存或者磁盘空间而不能够搭建集群环境,毕竟对于初学者来说,最重要的是先要让集群运行起来! 2, 两台机器的集群环境配置的步骤和三台以及多台机器完全一致。 3, 我们的教程是按照循序渐进的方式进行,后面会有三台机器和更多机器的集群运行环境。 具体的PDF版本教程请猛击这里。 王家林亲授的上海7月6-7日云计算分布式大数据Hadoop深入浅出案例驱动实战 王家林把自己几年来在Hadoop上的研究和实践总结出 阅读全文
posted @ 2013-06-14 21:13 王家林的Hadoop之旅 阅读(2513) 评论(9) 推荐(76) 编辑
摘要:此教程是王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”第三讲:证明Hadoop工作的正确性和可靠性只需4步图文并茂的过程。 具体的PDF版本教程请猛击这里。 王家林把自己几年来在Hadoop上的研究和实践总结出来,并通过动手实践的方式不断深入云就算实战技术,让人人皆可学习,并从中受益。 此教程来自于王家林多年的云计算实战研究和实践心得,全部免费教材为:云计算分布式大数据Hadoop实战高手之路(共3本书): 1,王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”带领您无痛入门Hadoop并能够处理Hadoop工程师的日常编程工作,进入云计算大数据的美好世界。 2, 王家林编写的“云计算分布式大数据Hadoop实战高手之路---高手崛起”通过数个案例实战和Hadoop高级主题的动手操作带领您直达Hadoop高手境界。 3, 王家林编写的“云计算分布式大数据Hadoop实战高手之路---高手之巅”通过当今主流的Hadoop商业使用方法和最成功的Hadoop大型案例让您直达高手之巅,从此一览众山小。 这 阅读全文
posted @ 2013-06-12 18:10 王家林的Hadoop之旅 阅读(1771) 评论(2) 推荐(39) 编辑
摘要:王家林,Hadoop,Ubuntu上搭建Hadoop环境,搭建Hadoop环境,王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第二讲Hadoop图文训练课程:全球最详细的从零起步搭建Hadoop单机和伪分布式开发环境图文教程(不放过任何一个细节) 工欲善其事,必先利其器。 本文从零起步构建Hadoop单机版本和伪分布式的开发环境,涉及: 1, 开发Hadoop需要的基本软件; 2, 安装每个软件; 3, 配置Hadoop单机模式并运行Wordcount示例; 4, 配置Hadoop伪分布式模式并运行Wordcount示例; 阅读全文
posted @ 2013-06-11 21:08 王家林的Hadoop之旅 阅读(3689) 评论(12) 推荐(15) 编辑
摘要:王家林“云计算分布式大数据Hadoop实战高手之路---从零开始”的第一讲Hadoop图文训练课程:10钟理解云计算分布式大数据处理框架Hadoop 家林会带您在10分钟内理解云计算分布式大数据处理框架Hadoop并开始动手实践,倒计时开始…… 阅读全文
posted @ 2013-06-10 22:06 王家林的Hadoop之旅 阅读(4774) 评论(35) 推荐(10) 编辑