随笔分类 - 云计算分布式大数据Hadoop实战高手之路---从零开始
王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”带领您无痛入门Hadoop并能够处理Hadoop工程师的日常编程工作。
摘要:这一讲我们主要剖析MapReduce的原理机制和流程。
“云计算分布式大数据Hadoop实战高手之路”之完整发布目录
云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云计算实战性资料,欢迎大家加入!
关于MapReduce,你至少需要知道以下几点:
1, MapReduce是运行于分布式文件系统之上的,在Hadoop中就是运行于HDFS之上的;
2, MapReduce主要用于大规模数据的并行运算,这种大数据通过指1TB以上;
3, MapReduce的运行原理是把一个大任务切割成很多并行运行的小任务,然后合并小任务运行完后的结果,从而得到最终结果;
阅读全文
摘要:在前面我们安装单机版Hadoop以及Hadoop集群的时候,我们使用的只是可以工作的最小化配置项,有很多重要的配置项都还没有提及。
阅读全文
摘要:王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第九讲Hadoop图文训练课程:剖析NameNode和Secondary NameNode的工作机制和流程
阅读全文
摘要:本讲通过实验的方式讲解Hadoop文件系统的操作。
云计算分布式大数据实战技术Hadoop交流群:312494188,每天都会在群中发布云计算实战性资料,欢迎大家加入!
首先我们看一些比较常用的Hadoop文件系统的操作命令:
阅读全文
摘要:这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群,主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程。
阅读全文
摘要:这一讲主要使用HDFS命令行工具操作Hadoop分布式集群初体验:
Step 1:使用HSFS命令向Hadoop分布式集群存放一个大文件;
Step 2:删除文件并用两份副本在HDFS上存放数据;
阅读全文
摘要:王家林 第四讲Hadoop图文训练课程:实战构建真正的Hadoop分布式集群环境Hadoop集群搭建的过程中出现的问题,具体的解决步骤是:
Step 1:查询Hadoop的日志看出错原因在哪里;
Step 2:停止集群工作;
Step 3:根据日志指出的原因进行解决,针对我们这里的问题,需要清空hadoop.main机器的hadoop根目录下的hdfs下的data文件;
Step 4:再次启动集群;
Step 5:进入hadoop.main的hdfs的web监控页面
Step 6:成功解决问题,若没有成功,重复Step 1~Step 5知道成功。
具体的34页的PDF版本实战构建真正的Hadoop分布式集群环境教程请猛击这里。
阅读全文
摘要:这一讲我们构建真正的Hadoop分布式集群环境:
1, 在VMWare 中准备第二台运行Ubuntu系统的机器;
2, 按照配置伪分布式模式的方式配置新创建运行Ubuntu系统的机器;
3, 配置Hadoop分布式集群环境;
4, 测试Hadoop分布式集群环境;
PS:为何搭建Hadoop分布式集群环境只用两台机器呢?原因如下:
1, 两台机器可以让人人皆可成功配置Hadoop集群运行环境,不会因为现有的机器内存或者磁盘空间而不能够搭建集群环境,毕竟对于初学者来说,最重要的是先要让集群运行起来!
2, 两台机器的集群环境配置的步骤和三台以及多台机器完全一致。
3, 我们的教程是按照循序渐进的方式进行,后面会有三台机器和更多机器的集群运行环境。
具体的PDF版本教程请猛击这里。
王家林亲授的上海7月6-7日云计算分布式大数据Hadoop深入浅出案例驱动实战
王家林把自己几年来在Hadoop上的研究和实践总结出
阅读全文
摘要:此教程是王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”第三讲:证明Hadoop工作的正确性和可靠性只需4步图文并茂的过程。
具体的PDF版本教程请猛击这里。
王家林把自己几年来在Hadoop上的研究和实践总结出来,并通过动手实践的方式不断深入云就算实战技术,让人人皆可学习,并从中受益。
此教程来自于王家林多年的云计算实战研究和实践心得,全部免费教材为:云计算分布式大数据Hadoop实战高手之路(共3本书):
1,王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”带领您无痛入门Hadoop并能够处理Hadoop工程师的日常编程工作,进入云计算大数据的美好世界。
2, 王家林编写的“云计算分布式大数据Hadoop实战高手之路---高手崛起”通过数个案例实战和Hadoop高级主题的动手操作带领您直达Hadoop高手境界。
3, 王家林编写的“云计算分布式大数据Hadoop实战高手之路---高手之巅”通过当今主流的Hadoop商业使用方法和最成功的Hadoop大型案例让您直达高手之巅,从此一览众山小。
这
阅读全文
摘要:王家林,Hadoop,Ubuntu上搭建Hadoop环境,搭建Hadoop环境,王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第二讲Hadoop图文训练课程:全球最详细的从零起步搭建Hadoop单机和伪分布式开发环境图文教程(不放过任何一个细节)
工欲善其事,必先利其器。
本文从零起步构建Hadoop单机版本和伪分布式的开发环境,涉及:
1, 开发Hadoop需要的基本软件;
2, 安装每个软件;
3, 配置Hadoop单机模式并运行Wordcount示例;
4, 配置Hadoop伪分布式模式并运行Wordcount示例;
阅读全文
摘要:王家林“云计算分布式大数据Hadoop实战高手之路---从零开始”的第一讲Hadoop图文训练课程:10钟理解云计算分布式大数据处理框架Hadoop
家林会带您在10分钟内理解云计算分布式大数据处理框架Hadoop并开始动手实践,倒计时开始……
阅读全文